AI支援の系統的レビュー手法

系統的レビューの現状

系統的レビューは、エビデンスに基づく医療（EBM）の頂点に位置する研究手法です。しかし、その実施には膨大な時間と労力が必要です。

完成までの平均期間：67週間（約1年3か月）
スクリーニングする論文数：平均 数千〜数万件
データ抽出にかかる時間：1論文あたり 30分〜2時間
2人の独立した評価者による二重チェックが標準

この労力の大きさが、系統的レビューの更新を遅らせ、「出版時にはすでに古い」という問題を引き起こしています。Cochrane Reviewの多くは、最新のエビデンスを反映できていません。

Borah らの2017年の研究によると、系統的レビューの完成までに要する期間は中央値67.3週間（IQR: 40-87週間）でした。AIツールの導入により、特にスクリーニング段階の効率化が進んでいます。

AI支援の系統的レビューワークフロー

プロトコル作成（PROSPERO登録）

研究目的、検索戦略、組入基準、データ抽出項目を事前に規定。PROSPEROに登録して透明性を確保。

網羅的文献検索

複数データベース（PubMed, Embase, CINAHL, Cochrane CENTRAL等）での検索。AIで検索式を最適化。

重複除去

複数データベースの重複をEndNote、Zotero、またはSyRF等で自動除去。

AIスクリーニング

タイトル・抄録スクリーニングをAIが優先順位付け。高確率の論文から順に人間がレビュー。

全文スクリーニング

AIが全文PDFから組入基準との適合性を評価。除外理由の候補を自動生成。

データ抽出

AIが論文からPICO要素、結果数値、バイアスリスク情報を構造化抽出。

質評価・メタアナリシス

バイアスリスク評価をAIが支援。可能であればメタアナリシスを実施。

AIスクリーニングツールの比較

Rayyan

Rayyanはカタール大学が開発した無料のAIスクリーニングツールです。

主な機能：

半自動的なスクリーニング支援（AIが関連度を予測）
ラベル・ハイライト機能でキーワードを視覚化
複数レビュアーの意見の不一致を管理
RISファイルのインポート・エクスポート
無料で利用可能

ASReview

ASReview（Amsterdam）は、能動学習（Active Learning）を使ったオープンソースのスクリーニングツールです。

主な機能：

能動学習で最も関連性の高い論文を優先的に提示
スクリーニングの進行とともに学習が改善
残りの論文数の推定（停止基準の支援）
Python ベースでカスタマイズ可能
完全オープンソース・無料

Covidence

CovidenceはCochrane公認のレビュー管理プラットフォームです。

主な機能：

検索結果のインポートから出版まで一気通貫
AIスクリーニング支援機能
構造化されたデータ抽出フォーム
リスクオブバイアステーブルの自動生成
Cochrane Reviewとの直接連携
有料（機関ライセンスあり）

手動スクリーニングAIスクリーニング

全論文を順番に1本ずつ評価。関連性の低い論文にも同じ時間をかける。途中でスクリーニング基準がぶれやすい。2人のレビュアーの作業量が均等に膨大。5,000件のスクリーニングに2-4週間。

AIが関連度スコアで優先順位付け。高関連度の論文から順にレビュー。AIのスコアがスクリーニング基準の一貫性を支援。関連論文が概ね見つかった時点で停止判断が可能。5,000件のスクリーニングが数日〜1週間に短縮。

ASReviewの実践ワークフロー

データのインポート

PubMed等からエクスポートしたRISファイルをASReviewにインポート。タイトル、抄録、著者情報が読み込まれる。

事前知識の入力（Prior Knowledge）

既に「関連あり」「関連なし」と分かっている論文をそれぞれ数本ラベル付け。これがAIの学習の出発点になる。最低5本ずつが推奨。

能動学習によるスクリーニング

AIが最も関連性が高いと予測する論文を順次提示。レビュアーが「Include」「Exclude」を判断するたびにAIモデルが更新される。

停止基準の適用

連続して一定数（例：100本）のExcludeが続いた場合、残りの論文は概ね無関連と判断できる。ただし、系統的レビューでは全件スクリーニングが推奨される。

AIスクリーニングは便利ですが、系統的レビューの方法論的要件を緩めるものではありません。Cochrane Handbookは2人の独立したレビュアーによるスクリーニングを要求しています。AIは「第三のレビュアー」として、あるいはスクリーニングの効率化ツールとして使用してください。AIのみによるスクリーニングは、現時点では系統的レビューの方法論的基準を満たしません。

AIによるデータ抽出

系統的レビューで最も時間のかかる作業の一つがデータ抽出です。AIを使って効率化する方法を解説します。

プロンプト

以下の論文から、系統的レビューのためのデータを抽出してください。

[論文のタイトル、抄録、または全文テキストを貼り付け]

以下の項目を抽出してください：

基本情報: 著者、年、国、ジャーナル、研究デザイン
対象集団: サンプルサイズ、年齢（平均±SD）、性別比、組入基準、除外基準
介入: 介入内容、用量、期間、投与経路
比較対照: 対照群の内容
主要アウトカム: 定義、測定方法、測定時期
結果: 主要結果（効果量、95%CI、p値）、副次結果
バイアスリスク情報: ランダム化方法、盲検化、脱落率、ITT解析の有無
資金源・利益相反: 製薬企業のスポンサー有無

抽出した情報に不明点がある場合は「Not reported」と記載してください。推測で補完しないでください。

PRISMAフローダイアグラムの作成

プロンプト

以下のスクリーニング結果から、PRISMA 2020フローダイアグラムのテキストを作成してください。

データベース別ヒット数:

PubMed: [件]
Embase: [件]
CINAHL: [件]
Cochrane CENTRAL: [件]

追加検索（引用追跡、ハンドサーチ等）: [件] 重複除去後: [件] タイトル・抄録スクリーニング後（除外数と主な理由）: [件] 全文スクリーニング後（除外数と各理由）: [件] 最終組入数: [件]

定量的統合（メタアナリシス）に含めた数: [件]
定性的統合のみ: [件]

PRISMA 2020の新しいフロー（レジスター/ウェブサイト検索を含む）に従ってください。

リビングシステマティックレビュー

AIの力を活用すると、「リビング（継続更新型）」系統的レビューが実現可能になります。

リビングシステマティックレビューとは、新しいエビデンスが出版されるたびに検索・スクリーニング・統合を更新し続ける系統的レビューです。従来は人的リソースの制約から困難でしたが、AIスクリーニングと自動文献モニタリングの組み合わせにより、現実的な選択肢になりつつあります。

リビングレビューの設計

自動アラート設定: PubMedのMy NCBIアラートやSemantic ScholarのResearch Feedsで新着論文を自動検出
AIスクリーニング: 新着論文をASReviewの学習済みモデルで自動分類
定期更新サイクル: 月次または四半期ごとにデータ抽出と統合を更新
バージョン管理: 各更新版を明確にバージョニング

この章のポイント

AIは系統的レビューの全工程を加速します。特にスクリーニング段階ではASReviewやRayyanの能動学習が劇的な時間短縮を実現します。ただし、AIツールは方法論的な厳密性を補完するものであり、置き換えるものではありません。2人のレビュアーによる独立評価、PRISMA準拠の報告、事前プロトコルの登録といった基本原則は変わりません。