メインコンテンツへスキップ
2 / 27|12分で読めます

AIによる文献ギャップ分析

既存エビデンスの穴を体系的に見つけ、新規性のある研究テーマを導出するAI活用手法。

AIによる文献ギャップ分析

なぜ文献ギャップ分析が重要か

前章でPICO/FINERフレームワークを使ってリサーチクエスチョン(RQ)を構造化しました。しかし、どれほど良いRQであっても、すでに十分なエビデンスが存在する領域に重複研究を行っても科学的価値は限定的です。

文献ギャップ分析とは、既存のエビデンスに「穴」がどこにあるかを体系的に明らかにする作業です。この作業により、以下のことが明確になります。

  • あなたのRQに対する先行研究の量と質
  • まだ答えが出ていないサブクエスチョン
  • 方法論的な限界(サンプルサイズ、フォローアップ期間、対象集団の偏り等)
  • 相矛盾する結果とその原因

文献ギャップ分析は、研究の「新規性」を客観的に裏付ける作業です。論文のIntroductionで"there is a gap in the literature"と書くなら、その根拠を示す必要があります。

従来の文献ギャップ分析 vs AI支援

従来の文献ギャップ分析AI支援の文献ギャップ分析

PubMedでキーワード検索を繰り返す。ヒットした論文のアブストラクトを1本ずつ読む。Excelで手作業でエビデンステーブルを作成。ナラティブにギャップを記述。見落としのリスクが高い。数日〜数週間を要する。

AIで検索式を最適化し網羅的に収集。AIで大量のアブストラクトを一括スクリーニング。AIがエビデンスを構造化テーブルに整理。AIがギャップを体系的に同定・分類。セマンティック検索で関連論文の見落としを防止。数時間〜1日で完了。

ステップ1: スコーピングサーチ

文献ギャップ分析の第一歩は、対象領域の全体像を把握する「スコーピングサーチ」です。

プロンプト

以下のリサーチクエスチョンについて、文献ギャップ分析のためのスコーピングサーチ戦略を設計してください。

RQ(PICO形式):

  • P: [対象集団]
  • I: [介入/曝露]
  • C: [比較対照]
  • O: [アウトカム]

以下を含めてください:

  1. 検索データベース: 推奨するデータベース(PubMed, Embase, CINAHL等)とその理由
  2. 検索語: 各PICO要素に対応するMeSHターム・フリーテキスト語のリスト
  3. 検索式: Boolean演算子を用いた検索式(PubMed形式)
  4. フィルター: 推奨する出版年、言語、研究デザイン等のフィルター
  5. 補完検索: ハンドサーチ、引用文献追跡、灰色文献の検索方法

Semantic Scholarの活用

Semantic Scholar(semanticscholar.org)は、AIベースの学術文献検索エンジンです。PubMedのキーワードマッチング検索とは異なり、論文の意味的類似性に基づく検索が可能です。

Semantic Scholarの強み:

  • TLDR機能: 論文の要約を1文で自動生成
  • Highly Influential Citations: 引用の質を評価(単なる言及 vs 研究に大きな影響を与えた引用)
  • Research Feeds: 関心領域の新着論文を自動通知
  • API: プログラマティックなアクセスが可能

ステップ2: エビデンスマップの作成

収集した文献をエビデンスマップとして整理します。エビデンスマップは、研究の「何が」「どの程度」行われているかを視覚化するものです。

プロンプト

以下の論文リストから、エビデンスマップを作成してください。

[論文リストを貼り付け - タイトル、著者、年、ジャーナル、アブストラクト]

以下の軸で分類してください:

  1. 研究デザイン: RCT / コホート / ケースコントロール / 横断研究 / 症例報告 / 系統的レビュー
  2. 対象集団: 年齢層、疾患ステージ、地域
  3. 介入/曝露: 具体的な介入内容
  4. アウトカム: 主要アウトカムの種類
  5. サンプルサイズ: 小規模(<100)/ 中規模(100-1000)/ 大規模(>1000)
  6. エビデンスの質: 高 / 中 / 低(簡易評価)

結果をマークダウンテーブルで出力し、最後にギャップの要約を記述してください。

ステップ3: ギャップの分類

文献ギャップには複数のタイプがあります。AIを使って、これらを系統的に同定します。

ギャップの5類型

ギャップの種類説明
Population gap特定の集団が研究されていない高齢者(75歳以上)のデータが少ない
Intervention gap新しい介入のエビデンスがない新薬の長期安全性データがない
Comparison gap重要な比較が行われていない薬物療法 vs 非薬物療法の直接比較がない
Outcome gap重要なアウトカムが評価されていない患者報告アウトカム(PRO)のデータがない
Methodological gap方法論的な限界があるRCTがなくコホート研究のみ、サンプルサイズ不足
プロンプト

以下のエビデンスマップに基づいて、文献ギャップを同定してください。

[エビデンスマップのテーブルを貼り付け]

以下の5つのギャップ類型それぞれについて分析してください:

  1. Population gap: 研究されていない対象集団
  2. Intervention gap: エビデンスが不足している介入
  3. Comparison gap: 行われていない重要な比較
  4. Outcome gap: 評価されていない重要なアウトカム
  5. Methodological gap: 方法論的な限界と改善の余地

各ギャップについて:

  • 具体的な内容
  • 臨床的重要性(高/中/低)
  • 研究で埋められる可能性(高/中/低)
  • 推奨される研究デザイン

ステップ4: Elicitを使った自動分析

Elicit(elicit.com)は、研究疑問に特化したAIツールです。文献ギャップ分析において特に有用な機能を持っています。

Elicitの活用法:

  1. 質問形式の検索: 自然言語でRQを入力すると、関連論文を自動収集
  2. 自動データ抽出: 各論文からPICO要素、サンプルサイズ、結果等を自動抽出
  3. エビデンスの統合: 複数論文の結果を比較・統合するテーブルを自動生成
  4. ギャップの可視化: 研究の分布パターンからギャップを視覚的に把握

Elicitに研究疑問を入力

PICO形式のRQをそのままElicitに入力する。英語で入力することで精度が向上する。

関連論文の自動収集

Elicitが意味的に関連する論文を自動で収集。タイトル・アブストラクトのスクリーニングが不要になる。

データ抽出カラムの設定

必要な情報(サンプルサイズ、介入内容、主要アウトカム、結果等)をカラムとして設定し、AIが各論文から自動抽出。

エビデンステーブルの分析

生成されたテーブルを俯瞰し、データの「空白」部分がギャップであることを確認する。

ステップ5: ギャップからRQの精錬へ

文献ギャップ分析の結果をもとに、RQを精錬します。

プロンプト

以下の文献ギャップ分析の結果をもとに、リサーチクエスチョンを精錬してください。

元のRQ: [PICO形式のRQ]

同定されたギャップ:

  • Population gap: [内容]
  • Intervention gap: [内容]
  • Comparison gap: [内容]
  • Outcome gap: [内容]
  • Methodological gap: [内容]

以下を提案してください:

  1. 精錬されたRQ(PICO形式)- ギャップを埋めるよう修正
  2. 精錬の根拠(どのギャップに対応しているか)
  3. 精錬されたRQの新規性の説明(論文Introductionのドラフト2-3文)
  4. 代替RQ案(異なるギャップに焦点を当てたもの)2-3個

注意すべき点

AIは「ギャップがある」と判断しても、実際にはAIの学習データに含まれていないだけで、文献が存在する場合があります。特に以下の場合に注意してください:

  • 非英語文献(日本語、中国語等の論文)
  • 灰色文献(学位論文、学会抄録、政府報告書)
  • 最近出版された論文(AIの学習データの更新ラグ)
  • 専門分野のニッチなジャーナル

必ずPubMed、Embase等の実際のデータベースで検証してください。

実践例:文献ギャップ分析の全プロセス

テーマ:高齢者の心房細動に対するDOACの安全性

  1. スコーピングサーチ: PubMed + Semantic Scholar で356件ヒット

  2. スクリーニング: AIでアブストラクト評価、87件が関連あり

  3. エビデンスマップ: 87件を分類

    • RCT: 12件(うち75歳以上のサブ解析あり: 4件)
    • コホート研究: 28件
    • 系統的レビュー: 8件
  4. ギャップ同定:

    • Population gap: 85歳以上の超高齢者のデータがほぼない
    • Outcome gap: 転倒・出血による入院のデータが不足
    • Methodological gap: 腎機能低下患者を除外した研究が多い
  5. 精錬されたRQ: 「85歳以上のCKDステージ3b以上を合併する心房細動患者において、減量DOACとワルファリンの比較で、大出血と転倒関連入院の複合アウトカムに差があるか」

この章のポイント

文献ギャップ分析は、「私の研究には新規性がある」という主張の科学的根拠です。AIを使って体系的にギャップを同定し、そのギャップを埋めるRQを設計することで、研究の価値を最大化できます。ただし、AIの出力は必ず実際のデータベースで検証してください。

次章の予告

次章では、構造化されたRQに対して最適な研究デザインを選択する方法を解説します。AIがどのように研究デザインの選択を支援できるかを、具体的なプロンプトとともに学びます。