top of page
検索

バイオマーカー解析をどう固定するか——製薬AIの判定条件と監査証跡(ADIC実用シリーズ 製薬編③)

バイオマーカーを使った患者選択は、精密医療の核心にある。そしてその選択が「科学的に正しいかどうか」だけでなく、「申請時に根拠を示しやすいかどうか」によっても評価される時代になっている。

例えば、ある腫瘍マーカーの発現量に基づいて患者を高リスク群と低リスク群に分類するAIがある。このAIが試験中に動いていたとき、「どの閾値で分類したか」「その閾値はプロトコルに事前定義されていたか」「途中で変更はなかったか」の三点は、申請と査察対応で論点化しやすい。

この三点に対応できる記録がないと、バイオマーカー解析の結果は申請根拠として扱いにくくなる。精度がどれほど高くても、判定条件の固定記録がなければ、審査担当者は結果の採用を慎重に判断せざるを得ない。



【対象成果物】この記事が扱う記録単位

本記事で扱うのは、バイオマーカー解析に関する以下の成果物セットだ。

プロトコル定義記録:バイオマーカーの定義、分類閾値、適用範囲がプロトコル確定時点で記録されたもの

閾値記録:閾値の版管理情報と、変更があった場合の変更理由・影響件数

実行ログ:各患者への閾値適用時のモデル版・入力値・出力スコア・判定結果・実行時刻

この3点セットが、プロトコル記述→モデル実装→実際の判定の連鎖を照合可能にする。


本質的な問題:「閾値の事前定義」はなぜ照合が難しいのか

プロトコルに「バイオマーカーXの発現量が閾値Y以上を高リスク群とする」と記載されていたとしても、実際のAI実装でその閾値が使われていたことを後から照合するのは別の問題だ。

問題の第一は、機械学習モデルが学習過程で閾値を最適化することにある。プロトコルに固定値を記載していても、モデルがデータ依存で閾値を変化させていた場合、プロトコルと実装の乖離が生じる。この乖離が「意図的な変更」なのか「実装の設計差」なのかは、ログがなければ区別しにくい。

問題の第二は、探索的解析と確認的解析の区別が曖昧になることにある。試験準備段階で最適な閾値を探索し、プロトコルに反映する流れが一般的だ。探索に使ったデータと確認的試験のデータが混在していた場合、「これは事前定義された解析か、事後的な調整か」という論点が発生しやすい。

問題の第三は、試験期間中のモデル更新だ。バグ修正や精度改善のために更新が行われた場合、更新前後のモデルが同じ閾値で同じ分類をしていたことが記録として残っていないと、論点化しやすくなる。閾値変更がどの患者の判定に影響したかまで追えることが重要になる。


なぜ現状の手順では照合が難しいのか

多くの製薬企業は、バイオマーカー解析の記録をスプレッドシートや文書管理システムで管理している。プロトコル、SAP、解析プログラム、結果レポートを別々のシステムで管理し、申請時に人手でまとめる運用だ。

この運用の限界は、「記録が存在すること」と「記録が照合可能な形で連鎖していること」が別問題であることにある。QA監査や査察対応者が求めるのは、プロトコルに記載した閾値と、AIが実際に使った閾値が、改ざんしにくい形でリンクされていることだ。

文書が存在する、ログが存在するというだけでは十分ではない。それらが連鎖した証跡として機能するには、「どの文書が、いつ、どのシステムに、どの状態で存在したか」を照合できる形で記録しなければならない。


ADICが固定する判定条件の構造

ADICは規制判断そのものを代替するものではない。ADICは、判定条件の記録と照合を行いやすい形で固定する実装基盤である。

第一の固定は、プロトコルロックだ。プロトコルに記載されたバイオマーカーの定義、分類閾値、適用範囲を記録する。この記録はプロトコル提出時点でタイムスタンプが付与され、以降の変更は変更管理プロセスを通じてのみ可能になる。

第二の固定は、モデルロックだ。試験開始前に確定したAIモデルのバージョン、閾値設定、前処理パイプラインをロックし、そのロック状態を暗号化ハッシュで記録する。試験期間中は、ロックされたモデルのみが患者分類に使用できる構造にする。停止トリガーとしては、バージョン不一致の検出、閾値テーブル差分の検出、事前定義外の入力データ形式の検出が設定される。

第三の固定は、実行ログだ。各患者の分類時に、使用モデルのバージョン、入力データの値、出力スコア、分類結果、実行時刻が記録される。この実行ログは変更しにくい形式で保存される。

閾値テーブルの版管理という観点では、閾値の更新があった場合、更新前後でどの検体にどの閾値が適用されたかの対照表が記録される。中間解析時点のロック状態と、閾値変更がどの患者の判定に影響したかの件数まで追えることが重要になる。


製薬実務での具体的な使いどころ

バイオマーカー解析でADICが機能する場面を具体的に示す。

コンパニオン診断と連動した組み入れ基準では、診断の判定ロジックとプロトコルの組み入れ基準が完全に対応していなければならない。ADICはこの対応を、診断システムとプロトコル文書の間の照合可能な記録として固定する。薬事審査の場面では、「組み入れ基準と診断判定の対応を示してほしい」という照会に対してSAP対応表を使って回答しやすくなる。

バイオマーカーの中間解析では、試験の中間解析でバイオマーカーの予測性を評価する際、事前定義外の解析条件に変更された場合にアラートを発し、解析を停止する。この停止条件があることで、探索的になった解析と確認的解析の区別を記録上維持しやすくなる。

申請後の照会への対応では、「バイオマーカー閾値の設定根拠を詳しく示してほしい」という照会が来たとき、ADICが管理した証跡連鎖を照合資料として整理しやすくなる。回答準備の工数を下げやすくなる。

【人間役割の明示】この場面での役割分担は、閾値設定の実行者(AI開発担当)、閾値のプロトコル整合確認者(統計・薬事レビュー担当)、最終承認者(試験責任者)、記録保全者(QA担当)の4者に分かれる。ADICはこの4者の作業記録を連鎖させる。


まとめ

バイオマーカー解析でAIを使うことは、精密医療の開発を加速する。しかしその加速は、判定条件の固定と監査証跡の設計がなければ、申請段階で説明負荷が高くなる。

「このAIは正確だった」という事後説明は照合可能な記録ではない。「このAIは、プロトコルに事前定義された条件通りに動いたことが照合しやすい形で記録されている」という構造が重要だ。

ADICは、バイオマーカー解析の開発段階から申請段階まで、この記録構造を維持するための基盤として機能する。

── GhostDrift Research より ──

GhostDrift Researchは、精密医療の発展を支持している。しかしその発展が申請・規制の場面での説明負荷によって止まることを問題視している。バイオマーカー解析の証拠設計は、ADICが最も直接的に貢献できる領域の一つだ。

 
 
 

コメント


bottom of page