メインコンテンツへスキップ
8 / 27|10分で読めます

多言語文献検索(英語・日本語・中国語)

英語以外の言語で出版された医学文献をAIで効率的に検索・活用する方法。日本語・中国語文献の探し方。

多言語文献検索(英語・日本語・中国語)

言語バイアスという見えないリスク

医学研究の世界では英語が共通語ですが、全世界の医学文献の約30%は英語以外で出版されています。系統的レビューにおいて英語文献のみを検索することは 言語バイアス(language bias) を引き起こします。

言語バイアスの具体的なリスクは以下の通りです。

  • 出版バイアスの増幅: 有意な結果を示す研究ほど英語で出版される傾向があり、非英語文献を除外すると効果量が過大評価される可能性
  • 地域特有のエビデンスの欠落: 各国の医療システム、食文化、遺伝的背景に基づく研究は現地語で出版されることが多い
  • 大規模データの見落とし: 中国語圏の臨床研究は膨大であり、英語データベースにインデックスされていないものが多数

Cochrane Handbookでは、系統的レビューの検索において言語制限を設けないことを推奨しています。実際に言語制限を外すと、含まれる研究数が10-20%増加するケースが報告されています。

日本語医学文献の検索

医中誌Web

医中誌Web(ichushi.or.jp)は、日本最大の医学文献データベースです。約1,500万件以上の文献を収録しており、日本語論文の検索には不可欠です。

医中誌Webの特徴:

  • 日本語のシソーラス(統制語)を使用
  • PubMedのMeSHに相当する体系的な分類
  • 抄録の日本語・英語両方を収録
  • 看護、薬学、歯学等の幅広い領域をカバー

CiNii Research

CiNii Research(cir.nii.ac.jp)は国立情報学研究所が提供する学術情報検索サービスです。医学だけでなく、社会科学や人文科学の文献も含みます。

J-STAGE

J-STAGE(jstage.jst.go.jp)は科学技術振興機構(JST)が提供する日本の学術雑誌の電子ジャーナルプラットフォームです。多くの論文が全文無料で公開されています。

AIによる日本語検索式の生成

プロンプト

以下のPubMed検索式を、医中誌Web用の日本語検索式に変換してください。

PubMed検索式: [英語の検索式]

以下を含めてください:

  1. 医中誌シソーラス用語: 各MeSHに対応する医中誌の統制語
  2. フリーテキスト語: 日本語の同義語、略語、一般的な表現
  3. 医中誌Web形式の検索式: 完成した検索式
  4. 注意点: 英語検索式との対応が不完全な部分の説明
  5. 補完が必要な検索語: 日本特有の用語や概念

中国語医学文献の検索

CNKI(China National Knowledge Infrastructure)

CNKIは中国最大の学術データベースで、中国の医学雑誌をほぼ網羅しています。

WanFang Data

WanFangは中国の学位論文、学会抄録を含むデータベースです。

CQVIP

CQVIPは中国の中文科学技術雑誌をカバーするデータベースです。

中国語文献データベースへのアクセスは、機関契約が必要な場合が多いです。また、一部の中国発RCTについてはデータの信頼性に関する懸念が報告されています(Carlisleの2017年の分析等)。中国語文献を系統的レビューに含める際は、バイアスリスクの評価をより慎重に行ってください。

AIによる多言語文献の活用

翻訳ワークフロー

非英語論文を発見した後の翻訳ワークフローを示します。

アブストラクトの翻訳・評価

AIで日本語/中国語のアブストラクトを英語に翻訳し、組入基準との適合性を評価する。この段階で大部分の論文が除外される。

全文の確認

アブストラクトスクリーニングを通過した論文の全文を入手。日本語論文はJ-STAGE等で、中国語論文はCNKI等で全文PDFを取得。

AIによる全文翻訳・データ抽出

全文をAIで翻訳し、必要なデータ(PICO要素、結果、バイアスリスク情報)を構造的に抽出する。

翻訳の質の検証

重要な数値(サンプルサイズ、効果量、p値)は原文と照合して翻訳精度を確認する。統計テーブルの数値は翻訳ミスが起きにくいため、原文で確認可能。

プロンプト

以下の日本語/中国語の論文からデータを抽出してください。

[論文の全文テキストまたはアブストラクトを貼り付け]

以下を英語で抽出してください:

  1. Study Design: 研究デザイン
  2. Setting: 実施施設・国
  3. Participants: サンプルサイズ、組入基準、除外基準
  4. Intervention/Exposure: 介入内容
  5. Comparator: 比較対照
  6. Primary Outcome: 主要アウトカムの定義と結果(効果量、95%CI、p値)
  7. Secondary Outcomes: 副次アウトカムの結果
  8. Risk of Bias indicators: ランダム化方法、盲検化、脱落率
  9. Funding/COI: 資金源と利益相反
  10. Key Conclusions: 著者の主要結論

日本語/中国語の原文も併記してください(翻訳の検証用)。

韓国語・その他言語の文献

KoreaMed

KoreaMed(koreamed.org)は韓国の医学文献データベースで、英語のアブストラクトが付いていることが多いです。

LILACS

LILACS(Latin American and Caribbean Health Sciences Literature)はラテンアメリカ・カリブ海地域の医学文献データベースで、スペイン語・ポルトガル語の文献をカバーします。

Global Health(CAB Abstracts)

Global Healthは熱帯医学、公衆衛生、栄養学などの分野で、開発途上国の文献を幅広くカバーするデータベースです。

多言語検索の実践的注意点

1. 言語制限の明示

検索の方法論セクションで、言語制限の有無を明確に記載します。

  • 「言語制限なし」: 全言語を検索対象とした
  • 「英語・日本語に限定」: 理由を記載(例:レビュアーの言語能力)
  • 「英語のみ」: 言語バイアスの可能性をLimitationsで議論

2. 翻訳の質保証

BeforeAfter

3. データベースのカバレッジ意識

地域主要データベースPubMedとの重複率
日本医中誌Web, J-STAGE約40-60%
中国CNKI, WanFang約20-30%
韓国KoreaMed, KMbase約50-70%
ラテンアメリカLILACS約30-50%
欧州(独語圏)LIVIVO, DIMDI約60-80%

この章のポイント

多言語文献検索は、系統的レビューの網羅性と言語バイアスの回避に不可欠です。AIの翻訳能力が飛躍的に向上した現在、言語の壁は以前ほど高くありません。医中誌Web、CNKI等の地域データベースとPubMedを組み合わせ、AIの翻訳・データ抽出機能を活用することで、多言語のエビデンスを体系的に統合できます。