検証可能なAIとは何か-海外一次文献から見るVerifiable AIと責任OSの位置付け

kanna qed
5 時間前
読了時間: 11分

はじめに

「検証可能なAI」という言葉は、日本ではまだ定義が固まっていません。

責任あるAI（Responsible AI）、説明可能なAI（Explainable AI）、安全なAI（Safe AI）——これらと並べて語られることはありますが、「検証可能なAI」が何を指すのかは、文脈によって揺れています。

海外の一次文献を見ると、"Verifiable AI" はまだ単一の標準語として固定されていません。実際には、Verified AI、AI verification、TEVV、AI assurance、conformity assessment、provenance、traceability、record-keeping、cryptographic verifiability などの語で、AIを後から確認可能にする議論が分散して進んでいます。

本稿はこの分散した語彙群を一次文献から整理し、それらのどこに責任OSが位置するのかを示します。責任OSは最後に出てきます。最初から責任OSを主語にすると恣意的に見えるためです。

▼責任OSに関するプレスリリースはこちら https://prtimes.jp/main/html/rd/p/000000004.000182721.html

1. Verified AI：モデルやAIシステムの性質を証明する系譜

「検証可能なAI」の原点の一つは、形式検証（formal verification）の系譜にあります。

Seshia, Sadigh, Sastryらは "Towards Verified Artificial Intelligence" の中で、数学的に指定された要求に対して、AIベースシステムが正しいことを保証する形式手法の適用を論じています。ここでいう verification は、仕様（specification）に対する証明可能な正しさです。

同様に、Katz et al.の "Reluplex" は、深層ニューラルネットワークの検証に特化したSMTソルバーです。ネットワークの挙動が指定された制約を満たすかどうかを形式的に確かめ、違反する入力（反例）を検出します。

この系譜での verification は、AIシステムやモデルの性質そのものを数学的に証明することです。

しかし、ここに重要な差分があります。この意味での verification は、AIシステムやモデルが正しいかどうかを扱います。企業がAI判断を正式運用で採用したとき、その採用判断を後から誰が確認できるか、という問いとは対象が異なります。

2. TEVV：AIライフサイクル全体を検査・評価・検証・妥当性確認する系譜

NISTのAI Risk Management Framework（AI RMF 1.0）は、信頼できるAIの特性として、妥当性・信頼性（Valid & Reliable）、安全性（Safe）、セキュリティ・堅牢性（Secure & Resilient）、説明可能性・解釈可能性（Explainable & Interpretable）、プライバシー保護（Privacy Enhanced）、公平性（Fair）、説明責任・透明性（Accountable & Transparent）を整理しています。

NIST AI Resource Centerは、AI RMFの運用化を支援するため、TEVV（Testing, Evaluation, Verification, Validation）に関する文書・ツール・ガイダンスを提供しています。TEVVは、AIが要求された目的に対して適切に動作するかを、開発から運用まで継続的に確認するプロセスです。

この文脈での「検証可能なAI」の定義はこうなります。

検証可能なAIとは、出力だけを見るものではない。データ、モデル、運用文脈、評価、監視、説明責任を含めて、AIシステムの信頼性をライフサイクル全体で確認できる状態に置くことです。

ただし、TEVVはAIシステムの信頼性の問題を扱います。個別のAI判断が、企業として正式に採用できる状態にあったかどうかを記録する問題とは、まだ焦点が異なります。

3. AI assurance：信頼性を証拠で評価・伝達する系譜

英国政府のCentre for Data Ethics and Innovation（CDEI）は、AI assuranceを「AIシステムの信頼性に関して、信頼できる証拠を評価し伝達する仕組み」として整理しています。この定義の核心は、「信頼と言う」ことではなく、「信頼性の証拠を評価し、伝達できる」ことです。

シンガポールのAI Verifyは、AI assuranceの実務例として、原則（principles）・成果（outcomes）・プロセス（processes）・証拠（evidence）を対応させ、documentary evidenceによって検証する枠組みを示しています。

ここに重要な転換があります。AIガバナンスは、理念の宣言から、証拠文書・検査プロセス・第三者確認へ移っています。

「責任あるAIを採用しています」という宣言は理念です。「この判断は、これらの条件を満たし、このプロセスで確認されました」という証拠文書は実務です。AI assuranceが問うのは後者です。

4. EU AI ActとISO/IEC 42001：検証可能性は制度要求になっている

EU AI Act（2024年8月発効/2026年8月本格適用）は、高リスクAIシステムに対して次を要求しています。

Article 12（Record-keeping）：ログの自動記録。高リスクAIの運用期間中、判断の追跡可能性を確保するための記録を保持すること。
Article 14（Human oversight）：人間がAI出力を理解・監視し、必要に応じて出力を使わない、無視する、上書きする、反転する能力を持つこと。
技術文書、透明性、適合性評価：モデルの性能・用途・限界・リスクを文書化し、適合性を評価できること。

ISO/IEC 42001:2023（AIマネジメントシステム）は、組織がAIを倫理的・説明責任ある・透明な方法で開発・提供・利用するための管理システムを求めています。リスク管理、監視、文書化、継続的改善が含まれます。

この段階では、検証可能なAIは研究テーマではなく、企業運用と制度対応の問題になっています。

ただし、ここで重要な問いが残ります。ログがある、技術文書がある、人間が確認した——これらは条件です。しかし、個別のAI判断が「誰が、どの条件で、どの未確認条件を残したまま採用したのか」を後から示せるかどうかは、これらの要件を満たすだけでは自動的には保証されません。

5. Provenance・Credentials・C2PA・AI-BOM：来歴と証拠は機械可読になっていく

海外では、検証可能性を「説明文書」だけでなく、機械可読な来歴・証拠として残す方向への取り組みが進んでいます。

W3C PROV-Oは、データや成果物の生成に関与したエンティティ・活動・エージェントの関係を標準的な語彙で記述するオントロジーです。情報がどこから来て、どの処理を経て生成されたかを機械可読に残すための標準です。

W3C Verifiable Credentials 2.0は、改ざん検知可能な主張（tamper-evident claims）とメタデータを、暗号学的に検証できる構造として標準化しています。証拠を第三者が確認できる形式で発行・保持するための基盤です。

C2PA（Coalition for Content Provenance and Authenticity）は、デジタルコンテンツの出所と編集履歴を確立するための標準です。AIが生成・編集したコンテンツについて、どのモデルが何を行ったかを記録可能にします。

CycloneDX AI/ML-BOMは、AIシステムの部品表として、モデル、データセット、依存関係、データ来歴、訓練方法を機械可読に記述する標準です。

これらは、検証可能性を「後から確認できる構造」として機械的に残す流れです。しかし、これらが主に扱うのは、データ、資格情報、コンテンツ、モデル、依存関係の来歴です。企業がAI判断を正式運用で採用した状態そのものの来歴は、これらの標準の直接の対象ではありません。

6. Model Cards・Datasheets・FactSheets：説明文書化の系譜と限界

モデルやデータセットやAIサービスを文書化する重要な流れがあります。

Model Cards for Model Reporting（Mitchell et al., 2019）は、AIモデルの想定用途・性能・評価条件・利用上の注意を文書化する手法です。モデルが何者であるかを透明にします。

Datasheets for Datasets（Gebru et al., 2018）は、データセットの動機・構成・収集過程・推奨用途・限界を文書化します。データが何者であるかを透明にします。

IBM AI FactSheetsは、AIサービスの目的、性能、安全性、セキュリティ、来歴・系譜を文書化するフレームワークです。

これらは、AI研究・実務において重要な貢献をしてきました。しかし、ここに限界があります。

これらの文書は、「AIシステムが何であるか」を説明するものです。「そのAI判断を企業が正式運用で採用した状態」そのものを記録するものではありません。

モデルカードがあっても、個別の判断がどの条件で採用されたか、誰が確認したか、未確認条件は何だったかは残りません。

7. 暗号学的検証可能性：AIパイプライン全体を証明する流れ

最近の研究では、AIパイプライン全体を暗号学的に検証可能にする方向が出てきています。

"A Framework for Cryptographic Verifiability of End-to-End AI Pipelines" などの研究では、データ取得、学習、推論、unlearningにいたるまで、AIの処理全体について暗号学的な証明を付与する構造を論じています。

この流れは、「後から証明できる」という主張を、数学的な根拠として残すという発想です。

責任OSが開発するADIC（Advanced Data Integrity by Ledger of Computation）は、AI判断の過程を第三者が後から再実行・検証できる証跡として残す技術基盤です。この暗号学的検証の流れと方向性は重なります。

ただし、責任OSとADICが扱うのは、暗号証明そのものではなく、AI判断を正式運用で採用できる責任状態を、後から確認可能な形で保持することです。

8. OWASP AISVS・Appia Foundation：セキュリティと適合証拠の最前線

OWASP AI Security Verification Standard（AISVS）は、AI対応システム向けの検証可能・テスト可能なセキュリティ要求事項を整理するフレームワークです。AIシステムのセキュリティを、テストと検証で確かめられる形で定義しています。

Appia Foundationは、2026年にAI value chain全体で conformity specifications（適合仕様）と assessable evidence（評価可能な証拠）を扱う標準化を掲げている最新動向です。AIが価値連鎖全体で適合性の証拠を持つべきという方向性を示していますが、まだ確立段階にあります。

これらは、検証可能なAIの実務・標準化の最前線です。そしてここでも、主な対象はAIシステムの適合性、セキュリティ、技術的性質です。

「AI判断を企業が正式運用で採用した際の責任状態を、後から確認可能にする」という問いは、これらの標準でも十分に定式化されていません。

9. 責任OSの位置付け：AI判断の採用状態を検証可能にする責任情報レイヤー

ここで初めて責任OSを主語にします。

海外で進む議論を整理すると、次のように分類できます。

系譜	主な対象
Verified AI / AI verification	モデル・AIシステムの性質の形式的証明
TEVV	AIライフサイクル全体のテスト・評価・検証・妥当性確認
AI assurance	信頼性の証拠を評価・伝達する仕組み
EU AI Act / ISO 42001	制度として要求されるログ・文書・監督・適合性評価
Provenance / VC / C2PA / AI-BOM	来歴・資格情報・部品表の機械可読化
Model Cards / Datasheets / FactSheets	モデル・データ・サービスの説明文書化
Cryptographic verifiability	AIパイプラインの暗号学的証明
OWASP AISVS / Appia	セキュリティ検証・適合証拠の標準化

これらが主に扱うのは、AIシステム・モデル・データ・パイプライン・セキュリティ・適合性です。

「AI判断を企業が正式運用で採用した際に、誰が、どの条件で、どの未確認条件を残したまま、どの責任状態として採用したのか」を後から確認可能にする層は、少なくとも主要な公開一次文献を見る限り、まだ明確には定式化されていません。

責任OSはその空白を扱います。

責任OSとは、AI判断を企業が正式運用で採用できる状態にするために、来歴、追跡可能性、監査証跡、メタデータ、未確認条件、責任状態を結び、「誰が、どの条件で、そのAI判断を採用したのか」を後から確認可能にする責任情報レイヤーです。

責任情報（Accountability-Relevant Information）は、AI判断について、結果だけでなく、来歴、監査証跡、追跡可能性、確認済み条件、未確認条件、関与主体、判断の順序を含めて、後から責任状態を確かめられるようにする情報です。

責任状態（Accountability State）は、ある時点における「誰が、どの根拠に基づき、何が確認済みで、何が未確認だったか」という状態の総体です。

ADICは、この責任情報の一部を数理的・証跡的に第三者が検証可能にする技術基盤です。ALS（Algorithmic Legitimacy Shift）は、人間確認だけでは構造的に責任状態を支えきれない局面を扱う理論です。

GhostDrift数理研究所は、これらの基礎理論をLean 4による形式証明として公開しています。これは、「後から検証できる」という主張そのものを、コンピューターが確かめられる数学的な形で固定する試みです。

※責任OSは、形式検証、来歴、監査証跡、AI assurance と無関係な新語ではない。むしろ、それらの既存系譜を前提にしている。独自性は、AIモデルそのものではなく、AI判断を企業が正式運用で採用する際の責任状態を第一対象に置く点にある。形式検証も、モデルの性能や安全性だけでなく、責任情報・未確認条件・判断順序・採用状態が後から確認可能に保持されることを確かめるために使われる。この点で責任OSは、既存のAI assuranceやaudit trailを置き換えるものではなく、それらを企業判断の採用状態へ接続する責任情報レイヤーである。

10. 広島発AIアシュアランス規格の意味

Hiroshima AI Process（2023年）の成果として示された International Code of Conduct は、安全・安心・信頼できるAI（safe, secure, trustworthy AI）を世界的に促進するための国際的な行動規範です。高度AIシステムに対して、AIライフサイクルを通じたリスク評価・軽減、説明責任、ガバナンスプロセス、リスク管理方針の開発・実践・開示を求めています。

しかし、この理念を企業の正式運用に落とすには、もう一段の問いが必要です。

AIを安全・安心・信頼できると宣言するだけでなく、個別のAI判断が「どの条件で採用されたのか」「誰が引き受けたのか」「後から確認できるのか」を責任情報として残せるかどうかです。

海外では、AI verification、TEVV、AI assurance、conformity assessment、provenance、documentation、cryptographic verifiabilityがそれぞれ発展しています。しかし、少なくとも主要な公開一次文献を見る限り、AI判断を企業が正式運用で採用する状態そのものを、責任情報として体系的に扱う層は、まだ明確には定式化されていません。

責任OSは、その空白に対する日本発の提案です。だからこそ、広島発AIアシュアランスの実装構想には大きな意味があります。

Hiroshima AI Processが示した「安全・安心・信頼できるAI」という国際行動規範を、現場で検証可能なAIアシュアランスへ落とすなら、AI判断の採用状態を責任情報として記録できる構造が必要になります。その日本発の実装構想として、広島発AIアシュアランスは「検証可能なAI」の国際議論に独自の貢献を果たしうる試みとなりえます。

まとめ

検証可能なAIとは、説明できるAIではありません。

AI判断を、企業が正式運用で採用できる状態として、後から確認できるAIです。

そのために必要なのは、来歴、追跡可能性、監査証跡、メタデータ、未確認条件、責任状態が一体で残る責任情報の構造です。海外で進む各系譜は、それぞれ重要な部分を担いますが、少なくとも主要な公開一次文献を見る限り、AI判断の採用状態を責任情報として後から確認可能にする層は、まだ明確には定式化されていません。

責任OSは、その層を担う日本発の試みです。

一次資料

形式検証

Seshia, S.A., Sadigh, D., Sastry, S.S. "Towards Verified Artificial Intelligence." arXiv:1606.08514
Katz, G. et al. "Reluplex: An Efficient SMT Solver for Verifying Deep Neural Networks." CAV 2017

AIリスク管理・TEVV

NIST "Artificial Intelligence Risk Management Framework 1.0" https://doi.org/10.6028/NIST.AI.100-1

AI assurance

UK CDEI "Enabling a trustworthy AI assurance ecosystem" https://www.gov.uk/government/publications/enabling-a-trustworthy-ai-assurance-ecosystem
Singapore IMDA "AI Verify" https://aiverifyfoundation.sg/

制度・標準

EU AI Act (Regulation (EU) 2024/1689), Article 12 / Article 14 https://eur-lex.europa.eu/eli/reg/2024/1689/oj/eng
ISO/IEC 42001:2023 – Artificial intelligence — Management system
Hiroshima Process International Code of Conduct https://www.mofa.go.jp/files/100573473.pdf

来歴・証拠の機械可読化

W3C PROV-Overview https://www.w3.org/TR/prov-overview/
W3C Verifiable Credentials 2.0 https://www.w3.org/TR/vc-data-model-2.0/
C2PA Specification https://c2pa.org/specifications/
CycloneDX AI/ML-BOM https://cyclonedx.org/capabilities/mlbom/

説明文書化

Mitchell, M. et al. "Model Cards for Model Reporting." FAccT 2019
Gebru, T. et al. "Datasheets for Datasets." Communications of the ACM, 2021
Arnold, M. et al. "FactSheets: Increasing trust in AI services through supplier's declarations of conformity." IBM Journal of R&D, 2019

セキュリティ・適合証拠