医療AI注目論文レビュー（2026年2月）

医療AIの進歩は加速の一途をたどっています。本記事では、2025〜2026年に発表された注目すべき論文・研究動向をピックアップし、臨床現場への影響を解説します。

1. LLMの臨床能力評価

金沢大学の研究チームは、最適化されたプロンプトとGPT-4を用いて日本の医師国家試験に合格可能な成績を達成したことを報告しました。この研究は、LLMが日本語の医学知識においても実用的な水準に達しつつあることを示す重要なマイルストーンです。

臨床的意義: LLMを医学教育の補助ツールとして活用する可能性が広がっています。ただし、これは「AIが医師の代わりになる」ことを意味するものではなく、あくまで知識ベースのテストにおけるパフォーマンスです。

2026年にJMIR Medical Educationに発表された多国籍コホート研究では、AIの適切な使い方のトレーニングを受けた一般内科医・総合診療医が、テストベースの臨床意思決定評価で有意に高いスコアを示しました。AI利用に対する信頼度も向上したと報告されています。

臨床的意義: 「AIを使うスキル」が臨床能力に直結することを示唆しており、医学教育カリキュラムへのAIリテラシー導入の根拠となります。

NEJM AIに発表されたプラグマティック・ランダム化比較試験では、Ambient AI（周囲の会話を聞いてカルテを自動生成するAI）が臨床ノート作成の負担軽減に有効であることが示されました。日常診療の中でのAI実装とモニタリングのフレームワークも提案されています。

臨床的意義: 医師の文書作成業務は勤務時間の大きな割合を占めています。Ambient AIの導入は、医師の働き方改革に直結する可能性があります。

うつ病、不安障害、摂食障害のリスクが高い成人を対象とした全国規模のランダム化比較試験で、ファインチューニングされた生成AIチャットボット「Therabot」が症状の有意な軽減と高いユーザーエンゲージメントを示しました。

臨床的意義: メンタルヘルス領域でのAI介入のエビデンスが蓄積されつつあります。特に、専門医不足が深刻な地域でのアクセス改善が期待されます。

系統的レビューにおけるバイアスリスク評価（RoB 2）にClaude 2を活用した研究がResearch Synthesis Methodsに発表されました。LLMがランダム化比較試験のバイアスリスク評価を支援できる可能性を探った先駆的な研究です。

臨床的意義: 系統的レビューの作成は膨大な労力を要します。AIによるスクリーニング支援は、エビデンス合成の効率化に貢献します。

Insilico Medicineは、AIが設計した化合物の前臨床候補から臨床試験への移行成功率100%を報告しています。特筆すべきは以下の点です：

ISM001-055（特発性肺線維症）: 従来4年かかる開発プロセスを18か月未満で人体試験に到達。Phase IIaで良好な結果
AlphaFold統合: AlphaFold2で予測されたタンパク質構造を用いて新規標的に対する確認済みヒット化合物を発見した初の報告例
AI創薬セクター全体: 2024年にVC投資33億ドル。Generate:Biomedicinesの10億ドルNovartisパートナーシップ、Isomorphic Labsの6億ドル超の拡大

臨床的意義: AI創薬は「概念実証」の段階を超え、実際の臨床試験で効果を示す段階に入りました。今後5〜10年で、AI設計薬剤の上市が現実味を帯びてきています。

世界経済フォーラムの報告によると、AI診断システムが一部の領域で専門医の2倍の精度を達成しています。特に：

臨床的意義: AI診断支援は「見落とし防止」という観点で特に有用です。ただし、最終的な診断・治療方針の決定は人間の医師が行うべきであり、AIはあくまでサポートツールです。

2024年にNEJMがNEJM AIを創刊し、医療AIの厳格なRCTと研究基準を確立するプラットフォームが整いました。これにより、医療AI研究のエビデンスレベルが引き上げられることが期待されます。

2022年時点で世界で41件だった医療AI介入のRCTは、2024年までに86件に倍増しました。ただし、Nature Medicineの視点論文では、医療AIモデルは異なるユーザー、医療システム、地域、疾患、集団への自動適応（コンテキストスイッチング）が今後の重要課題であると指摘されています。

2025〜2026年の医療AI研究は、以下のトレンドが顕著です：

注意: 本記事の内容は、公開されている研究結果に基づいています。医療上の意思決定は、必ず最新のエビデンスと担当医師の判断に基づいて行ってください。