Medical AI Newsletter #4
2026年2月24日号 | 拡張思考・FDA承認・国内保険収載 特集
今週のハイライト
Claude 3.7 Sonnet「拡張思考」モード — 複雑な臨床推論への応用
Anthropicが発表したClaude 3.7 Sonnetの「拡張思考(Extended Thinking)」機能が、医療領域での活用に注目を集めています。通常モードよりも多くのトークンを推論に使い、医師のような段階的な鑑別診断プロセスを模倣できる点が特徴です。
Hoshizu検証チームで試した結果、複雑な感染症ワークアップ(不明熱・多臓器不全の組み合わせ)では、通常モードより鑑別の網羅性と優先順位付けが大幅に改善しました。特に「なぜこの診断が上位にあるのか」の根拠提示が明確になる点が、臨床現場での信頼性確保に有効です。
拡張思考の使いどころ
- 有効: 不明熱、稀な疾患、複数の併存疾患がある複雑症例
- 通常モードで十分: 一般的な主訴、プロトコル確認、患者説明文書の作成
- コスト注意: トークン消費が多く、日常使いには不向き
FDA、AI ECG解析システムを新適応で承認 — 特発性心室細動の早期検出
FDAが、心電図の微細な波形変化からSudden Cardiac Arrest(SCA)のリスクを事前に検出するAIシステムを承認しました(De Novo申請)。既存の心電図診断AIは主に心房細動・STEMI検出が主軸でしたが、本システムは特発性心室細動の前駆期変化を検出する点で新しいカテゴリです。
承認の根拠となった多施設後向きコホート研究では、SCA発症72時間以内の心電図でAUC 0.83を達成。現行のQT延長モニタリングと組み合わせることで、既存の方法では検出できない30%のSCAリスク患者を特定できると報告されています。
注意点
後向きデータのみでの検証であり、前向き介入研究でのアウトカム改善はまだ示されていません。「リスク検出ツール」であり「予後改善ツール」ではない点を認識して使うことが重要です。
国内初 — AI内視鏡診断支援システムが保険収載
厚生労働省の中央社会保険医療協議会(中医協)が、大腸がんAI内視鏡診断支援システムへの保険点数収載を正式決定しました。国内初のAI内視鏡診断の保険収載となります。
対象は内視鏡的大腸ポリープ切除術の際のAI補助診断。適切な保険点数(加算方式)が設定され、導入コストの問題で普及が進んでいなかった中小規模の病院・クリニックへの展開加速が期待されます。
医師へのアクション
- AI支援による過剰切除・過少診断の変化をトラッキングする施設内データ収集の準備を
- 患者への「AI支援を使用している」というインフォームドコンセントの手続き整備が必要
- 診療録への記録方法(AI使用の記載義務等)を確認
注目論文
GPTZero、ICLR 2026で「医療文書ハルシネーション検出」論文を発表
GPTZeroチームがICLR 2026で発表したプレプリントが注目を集めています。医師向けLLMが生成するサマリー・SOAP note・退院サマリーにおけるファクトエラーを、文書の原文と照合して検出するフレームワークを提案。GPT-4oやClaude 3.5 Sonnetで生成したテキストに対し、精度83%・再現率79%でハルシネーションを検出できると報告しています。
特に「数値の誤り」(薬剤量、検査値の誤記入)の検出精度が高く、医療AIの安全運用に直結するユースケースとして評価されています。
- arXiv プレプリント(ICLR 2026 提出版)
LLMによる退院サマリー自動生成 — 多施設RCT
米国3施設での多施設RCTで、LLMが生成した退院サマリーのドラフトと、医師が手書きした従来のサマリーの品質を比較。LLMドラフト+医師レビュー条件では、サマリー作成時間が平均42分から11分に短縮、かつ情報網羅性スコアは有意に向上しました(p<0.001)。一方、ハルシネーションエラーは全体の4.2%に認められ、医師の最終確認が必須であることが再確認されました。
- 対象: 入院患者1,847例
- LLMドラフトの採用率: 67%(医師が大幅修正なしに承認)
- 有害なハルシネーション: 0.3%(薬剤量誤り2例、アレルギー誤記1例)
マルチモーダルAIが病理診断医の精度を向上 — Lancet Oncology
乳がん病理診断においてマルチモーダルAI(病理画像+臨床情報)を使用したグループと、通常診断のみのグループを比較。AI支援グループでは、リンパ節転移の見落とし率が有意に低下(8.3% → 3.1%)し、診断時間も短縮。ただしAIへの過信による「確認省略」が問題となるケースも報告されており、適切なワークフロー設計が鍵となります。
規制・政策動向
PMDA「AIワーキンググループ」第3回会合 報告公開
PMDAのAI対応WGが第3回会合の報告書を公開。主要議題は「AIによる医療機器の継続的学習(Continual Learning)の規制上の扱い」。承認後に性能が変化するAIシステムについて、どこまでの変化が「変更承認不要」の範囲に収まるかのガイドライン策定に向けた議論が進んでいます。
特に注目すべきは「Locked AIとAdaptive AIの定義の整理」。国内製造業者が期待していた「一定範囲内のモデル更新は事後届出で対応可能」という方向性が示唆されました。
EU AI Act — 医療機器適用ガイダンス草案 パブコメ開始
欧州委員会が、医療機器に適用されるEU AI ActとMDR(医療機器規則)の関係を整理したガイダンス草案を公開し、パブリックコメントを募集中(締切: 2026年3月31日)。
主要ポイント:
- 診断支援AIは原則「High-Risk AI System」に分類
- CE-Markとの二重要件をどう効率化するかが焦点
- 日本企業の欧州展開にも影響大
プレプリント注目
- BioMedLM-2: Stanford発、医療専門に特化した14Bパラメータの言語モデル。USMLE Step 1-3で平均85%の正答率を達成 (arXiv)
- RadGraph-2: 放射線レポートから構造化知識グラフを自動構築するNLPフレームワーク、GPT-4oベース (arXiv)
- MedAgentBench: 多段階医療推論のAI評価ベンチマーク。既存のMedQA・MedMCQAとの相関・差異を詳細分析
- Electronic ICU AI: 遠隔ICU集中管理AIの安全性・有効性に関する多施設後向き研究(米国7 ICU、12ヶ月)
今週のまとめ
今週の全体像
「承認・保険収載」の動きが国内外で加速した一週間でした。FDAの新規適応承認、国内初の内視鏡AI保険収載と、医療AIがいよいよ「研究」から「診療報酬で評価される実診療ツール」へ移行するフェーズに入っています。同時に、LLMハルシネーション検出の研究進展が示すように、安全な実装のための技術的インフラ整備も急速に進んでいます。
「承認されたから安全」ではなく、「適切なワークフローで使う」ことが、これからの医師に求められるリテラシーです。
次号予告: 3月第1週は「AI研修医教育特集」を予定。シミュレーション・ラーニング×AIの最新動向をお届けします。