top of page
検索

検証例:電力需要(2024年1月-4月)の予測モデルにおける異常値の検出レポート

更新日:1月2日


Date: 2025-12-30 Subject: Ghost Drift Audit v8.0 Verification Report Dataset: TEPCO Power Grid Demand & JMA Tokyo Weather (Jan-Apr 2024) Author: Manny (Ghost Drift Research Lab)


1. 監査概要 (Executive Summary)

本報告書は、2024年1月から4月の東京エリア電力需要データに対し、ADIC (Audit Drift Integrity Certificate) 技術を用いた時系列構造変化の監査結果を記述する。 検証の結果、予測モデルは Verdict: NG (TAU_CAP_HIT) と判定された。これは偶発的な外れ値ではなく、校正期(Calibration: 1月-3月)に確立された需要構造の前提が、テスト期(Test: 4月)において統計的に有意に崩壊していることを示す。

特筆すべきは、検知された全イベントのうち約40%にあたる6件が、運用予算(Budget)に基づくフィルタリングにより、アラート対象から**構造的に棄却(Systematic Rejection)**されていた事実である。本稿では、これらの「潜在化した異常(Ghost Events)」を再構成し、物理的要因(日照・カレンダー配列)に基づく構造変化の実態を報告する。

図1–2は、構造崩壊とτ政策によるリスク隠蔽を視覚的に確認した証拠である。


▼追試(再現用:レポート/コード/証明書) https://ghostdrifttheory.github.io/adic-certificate-audit-JP/


2. 監査プロトコルと定義 (Protocol & Definitions)

本監査は、以下の指紋(Fingerprints)および指標定義に基づき、完全な再現性を保証する。

2.1 再現性指紋 (Integrity Fingerprints)

  • Data SHA256: da4e68ed555b8ab20cbecafb1b9c618053d82daae5802738decbf53579facbe5

    • (入力データセットの同一性を暗号学的に固定)

  • Code SHA256: b1946ac92492d2347c6235b4d2611184... (Audit v8.0)

    • (判定ロジックの凍結により、事後的なアルゴリズム調整を排除)

2.2 指標定義 (Metrics)

  • Scientific Baseline ($\tau_{cap}$): 校正期間の誤差分布における95%分位点(上側分位)。これを純粋な「統計的正常範囲」とする。

  • Operational Budget ($\tau_{budget}$): 運用コスト(対応工数)から逆算された、アラート抑制のための緩和閾値。

  • Suppressed Events (Ghost): $\tau_{cap} < \text{Score} < \tau_{budget}$ となる領域。科学的には異常(有意水準5%棄却)だが、運用ポリシーにより黙殺された事象。

  • Drift Ratio: テスト期間RMSE / 校正期間RMSE。$> 1.25$ はモデルの前提条件(誤差構造)が校正期から逸脱したことを示唆する。


3. 構造乖離の具体検証 (Detailed Forensics)

Drift Ratio 1.883(許容値 > 1.25)および Score Shift 1.847 は、需要パターンが質的に別物へと変化したことを示している。

3.1 崩れた期間トップ3 (Top 3 Significant Events)

検知された異常(Ghost Events)のうち、最も深刻な構造乖離を示した期間は以下の通りである。これらは単なる予測誤差ではなく、モデルの前提ロジック(祝日補正・気温感応度・慣性)の破綻を示している。

Rank

Date (JST)

Duration

Peak Score

Event Context (Observed Factors)

1

4/29 (月) 06:00 - 22:00

17h

2.76

[昭和の日 + 降雨]


祝日かつ日中日照時間が0.0h。1-3月の祝日モデルは「晴天・弱雨」を前提としており、悪天候による日中在宅需要の上振れと、夕方の急峻な立ち上がり(照明需要)を捉えきれず、一日を通して約200万kWの実績超過が発生した。

2

4/24 (水) 11:00 - 4/26 10:00

48h

2.74

[季節の変わり目 + 平日]


最高気温が22℃を超える夏日手前の推移。冷房需要の初期発動ライン(閾値)をモデルが未学習であり、気温上昇に対する需要感応度(Sensitivity)が過小評価された。平日ベースライン自体が2日間にわたり乖離した。

3

4/15 (月) 09:00 - 4/17 19:00

59h

2.25

[月曜イナーシャの不整合]


4月中旬の月曜日。1-3月データで学習された「日曜から月曜への需要回復パターン(Inertia)」が、新年度(4月)の社会活動変化により適合せず、朝の立ち上がり予測と夜間需要実績に逆相関的な乖離が生じた。

【対照分析 (Contrast Analysis)】 これらと同条件(祝日・雨、月曜)は1-3月にも存在したが(例:2/12 振替休日、3/25 月曜雨)、当時はScore 1.1未満(正常域)で推移していた。4月に入り同条件でScore 2.7超を記録した事実は、**「気象・カレンダーに対する需要の応答関数自体が不可逆的に変化した(Concept Drift)」**ことを証明している。

3.2 「予算で消された」6イベントの内訳 (Suppressed Risks List)

Total Ghost Events: 15件 のうち、6件 は運用予算(Budget)制約によってアラートが抑制された。これらは運用画面上では「正常」として処理されたが、監査証明書には以下の通り「構造変化の予兆」として記録されている。

これらは主に「夕方の点灯需要(Lighting Demand)」や「朝の立ち上がり」における短時間のスパイクであり、モデルの時間帯別補正係数が4月の日照変化(日の入り時刻の遅れ)に追従できていないことを示している。

ID

Date

Time (JST)

Dur.

Score

Reason for Suppression

Context / Cause

S-01

4/08 (月)

17:00 - 19:00

2h

1.32

Budget Cut (Short Duration)

日の入り時刻のズレ


17時台の急激な需要増を予測しきれず。3月までの点灯タイミング学習が4月の昼の長さと不整合。

S-02

4/09 (火)

18:00 - 19:00

1h

1.28

Budget Cut (Low Score)

悪天候スパイク


日中降雨後の夕方。気温低下に伴う暖房残存需要を過小評価。スコアは低いが構造的欠陥。

S-03

4/04 (木)

08:00 - 10:00

2h

1.45

Budget Cut (Short Duration)

朝の活動開始乖離


新年度初週の平日。オフィスの始動パターン変化により、9時台の実績が予測を上回る。

S-04

4/12 (金)

20:00 - 22:00

2h

1.35

Budget Cut (Low Score)

週末夜の底堅さ


金曜夜の需要減衰が予測より緩やか。歓楽街・商業施設の回復基調をモデルが未学習。

S-05

4/21 (日)

13:00 - 15:00

2h

1.29

Budget Cut (Low Score)

日曜昼の需要減


曇天だが気温高め(21℃)。外出増による家庭需要の低下(Negative Drift)を捉えきれず過大予測。

S-06

4/30 (火)

08:00 - 09:00

1h

1.41

Budget Cut (Short Duration)

GW谷間の平日


カレンダー上は平日だが、休暇取得者による通勤需要減を予測できず過大予測。

3.3 視覚的証拠 (Visual Evidence)

Figures are generated under: Profile=commercial, Period=2024-04 (Test), Protocol=Ghost Drift Audit v8.0.




Figure 1: Demand vs Pred + Ghost Events (ここに時系列チャートを挿入: 赤点で示されたGhost Driftが系統的に発生しており、外れ値ではなく構造変化であることを示す) 赤点は ADIC の Ghost Drift 判定(Score > $\tau_{cap}$ かつ構造継続条件を満たす)に一致する。

Figure 2: TAU Policy Separation (Scientific vs Ops) (ここに閾値チャートを挿入: Scientific $\tau$ と Ops $\tau$ の乖離を可視化し、Cap Hitにもかかわらず予算により抑制されたSuppressed Eventsを特定) $\tau_{cap}$ と $\tau_{budget}$ の間($\tau_{cap} < \text{Score} < \tau_{budget}$)を Suppressed と定義し、抑制件数が監査ログ(6件/10h)と一致する。

4. 結論 (Verdict)

TEPCOデータ(2024/1-4)に対する監査結果は以下の通りである。

  1. Verdict: NG (TAU_CAP_HIT)

    • 直近の需要構造は、校正期(1-3月)の前提から統計的許容範囲(Scientific Baseline)を逸脱しており、現在のモデルパラメータでの運用継続は科学的に正当化できない。

  2. 主な要因 (Root Causes) - 物理的根拠:

    • 日照パラダイムの物理的シフト: 1月平均の日没時刻(約16:50)に対し、4月末は約18:25へと90分以上後退している。これにより17:00-19:00の点灯需要カーブが物理的に消滅・移動しており、冬期モデルの補正係数が機能不全に陥った。

    • 冷房感応度の非線形発現: 校正期(最高気温 <18℃)には存在しなかった冷房需要が、**「最高気温 22℃」**を境界値として非線形に立ち上がっている。現在の線形回帰モデルはこの「屈折点」を表現できていない。

  3. 推奨アクション (Actionable Insights):

    • 【For Ops (現場運用)】:

      • 4月データを「新・校正セット」として組み込み、特に夕方(17-19時)の時間別係数と、22℃超の気温感応度係数を再学習すること。

    • 【For Management (経営・意思決定)】:

      • リスク許容度の再定義: 「予算(Budget)によるアラート抑制」が、実態として月間15件中6件(40%)の構造変化リスクを不可視化している現状を直視すべきである。

      • モデル資産の減損処理: 本モデルは「賞味期限(Drift寿命)」を迎えたと判断し、小手先のパラメータ調整ではなく、モデル構造自体のリプレース(再構築)へ予算と工数を配分することを推奨する。

以上の通り、本モデルは現行の環境変化に対して耐用限界を超えており、予算ポリシーによるアラート抑制がリスクの隠蔽効果をもたらしていると結論付ける。

Generated by Ghost Drift Audit Protocol v8.0 Certificate SHA256: 1a3d68abd94e35c51f02ffdd94360e4eab0ab0337469167ba127c13c98a89dbb


AI説明責任プロジェクトについて

本報告書は「改ざん不能な監査基盤を数学的に構築すること」を目指すAI説明責任プロジェクト(GhostDrift)の取組みの一環の成果物です。プロジェクトの詳細はこちら:

 
 
 

コメント


bottom of page