AI支援の系統的レビュー手法
系統的レビューの現状
系統的レビューは、エビデンスに基づく医療(EBM)の頂点に位置する研究手法です。しかし、その実施には膨大な時間と労力が必要です。
- 完成までの平均期間:67週間(約1年3か月)
- スクリーニングする論文数:平均 数千〜数万件
- データ抽出にかかる時間:1論文あたり 30分〜2時間
- 2人の独立した評価者による二重チェックが標準
この労力の大きさが、系統的レビューの更新を遅らせ、「出版時にはすでに古い」という問題を引き起こしています。Cochrane Reviewの多くは、最新のエビデンスを反映できていません。
Borah らの2017年の研究によると、系統的レビューの完成までに要する期間は中央値67.3週間(IQR: 40-87週間)でした。AIツールの導入により、特にスクリーニング段階の効率化が進んでいます。
AI支援の系統的レビューワークフロー
プロトコル作成(PROSPERO登録)
研究目的、検索戦略、組入基準、データ抽出項目を事前に規定。PROSPEROに登録して透明性を確保。
網羅的文献検索
複数データベース(PubMed, Embase, CINAHL, Cochrane CENTRAL等)での検索。AIで検索式を最適化。
重複除去
複数データベースの重複をEndNote、Zotero、またはSyRF等で自動除去。
AIスクリーニング
タイトル・抄録スクリーニングをAIが優先順位付け。高確率の論文から順に人間がレビュー。
全文スクリーニング
AIが全文PDFから組入基準との適合性を評価。除外理由の候補を自動生成。
データ抽出
AIが論文からPICO要素、結果数値、バイアスリスク情報を構造化抽出。
質評価・メタアナリシス
バイアスリスク評価をAIが支援。可能であればメタアナリシスを実施。
AIスクリーニングツールの比較
Rayyan
Rayyanはカタール大学が開発した無料のAIスクリーニングツールです。
主な機能:
- 半自動的なスクリーニング支援(AIが関連度を予測)
- ラベル・ハイライト機能でキーワードを視覚化
- 複数レビュアーの意見の不一致を管理
- RISファイルのインポート・エクスポート
- 無料で利用可能
ASReview
ASReview(Amsterdam)は、能動学習(Active Learning)を使ったオープンソースのスクリーニングツールです。
主な機能:
- 能動学習で最も関連性の高い論文を優先的に提示
- スクリーニングの進行とともに学習が改善
- 残りの論文数の推定(停止基準の支援)
- Python ベースでカスタマイズ可能
- 完全オープンソース・無料
Covidence
CovidenceはCochrane公認のレビュー管理プラットフォームです。
主な機能:
- 検索結果のインポートから出版まで一気通貫
- AIスクリーニング支援機能
- 構造化されたデータ抽出フォーム
- リスクオブバイアステーブルの自動生成
- Cochrane Reviewとの直接連携
- 有料(機関ライセンスあり)
全論文を順番に1本ずつ評価。関連性の低い論文にも同じ時間をかける。途中でスクリーニング基準がぶれやすい。2人のレビュアーの作業量が均等に膨大。5,000件のスクリーニングに2-4週間。
AIが関連度スコアで優先順位付け。高関連度の論文から順にレビュー。AIのスコアがスクリーニング基準の一貫性を支援。関連論文が概ね見つかった時点で停止判断が可能。5,000件のスクリーニングが数日〜1週間に短縮。
ASReviewの実践ワークフロー
データのインポート
PubMed等からエクスポートしたRISファイルをASReviewにインポート。タイトル、抄録、著者情報が読み込まれる。
事前知識の入力(Prior Knowledge)
既に「関連あり」「関連なし」と分かっている論文をそれぞれ数本ラベル付け。これがAIの学習の出発点になる。最低5本ずつが推奨。
能動学習によるスクリーニング
AIが最も関連性が高いと予測する論文を順次提示。レビュアーが「Include」「Exclude」を判断するたびにAIモデルが更新される。
停止基準の適用
連続して一定数(例:100本)のExcludeが続いた場合、残りの論文は概ね無関連と判断できる。ただし、系統的レビューでは全件スクリーニングが推奨される。
AIスクリーニングは便利ですが、系統的レビューの方法論的要件を緩めるものではありません。Cochrane Handbookは2人の独立したレビュアーによるスクリーニングを要求しています。AIは「第三のレビュアー」として、あるいはスクリーニングの効率化ツールとして使用してください。AIのみによるスクリーニングは、現時点では系統的レビューの方法論的基準を満たしません。
AIによるデータ抽出
系統的レビューで最も時間のかかる作業の一つがデータ抽出です。AIを使って効率化する方法を解説します。
以下の論文から、系統的レビューのためのデータを抽出してください。
[論文のタイトル、抄録、または全文テキストを貼り付け]
以下の項目を抽出してください:
- 基本情報: 著者、年、国、ジャーナル、研究デザイン
- 対象集団: サンプルサイズ、年齢(平均±SD)、性別比、組入基準、除外基準
- 介入: 介入内容、用量、期間、投与経路
- 比較対照: 対照群の内容
- 主要アウトカム: 定義、測定方法、測定時期
- 結果: 主要結果(効果量、95%CI、p値)、副次結果
- バイアスリスク情報: ランダム化方法、盲検化、脱落率、ITT解析の有無
- 資金源・利益相反: 製薬企業のスポンサー有無
抽出した情報に不明点がある場合は「Not reported」と記載してください。推測で補完しないでください。
PRISMAフローダイアグラムの作成
以下のスクリーニング結果から、PRISMA 2020フローダイアグラムのテキストを作成してください。
データベース別ヒット数:
- PubMed: [件]
- Embase: [件]
- CINAHL: [件]
- Cochrane CENTRAL: [件]
追加検索(引用追跡、ハンドサーチ等): [件] 重複除去後: [件] タイトル・抄録スクリーニング後(除外数と主な理由): [件] 全文スクリーニング後(除外数と各理由): [件] 最終組入数: [件]
- 定量的統合(メタアナリシス)に含めた数: [件]
- 定性的統合のみ: [件]
PRISMA 2020の新しいフロー(レジスター/ウェブサイト検索を含む)に従ってください。
リビングシステマティックレビュー
AIの力を活用すると、「リビング(継続更新型)」系統的レビューが実現可能になります。
リビングシステマティックレビューとは、新しいエビデンスが出版されるたびに検索・スクリーニング・統合を更新し続ける系統的レビューです。従来は人的リソースの制約から困難でしたが、AIスクリーニングと自動文献モニタリングの組み合わせにより、現実的な選択肢になりつつあります。
リビングレビューの設計
- 自動アラート設定: PubMedのMy NCBIアラートやSemantic ScholarのResearch Feedsで新着論文を自動検出
- AIスクリーニング: 新着論文をASReviewの学習済みモデルで自動分類
- 定期更新サイクル: 月次または四半期ごとにデータ抽出と統合を更新
- バージョン管理: 各更新版を明確にバージョニング
この章のポイント
AIは系統的レビューの全工程を加速します。特にスクリーニング段階ではASReviewやRayyanの能動学習が劇的な時間短縮を実現します。ただし、AIツールは方法論的な厳密性を補完するものであり、置き換えるものではありません。2人のレビュアーによる独立評価、PRISMA準拠の報告、事前プロトコルの登録といった基本原則は変わりません。