多言語文献検索(英語・日本語・中国語)
言語バイアスという見えないリスク
医学研究の世界では英語が共通語ですが、全世界の医学文献の約30%は英語以外で出版されています。系統的レビューにおいて英語文献のみを検索することは 言語バイアス(language bias) を引き起こします。
言語バイアスの具体的なリスクは以下の通りです。
- 出版バイアスの増幅: 有意な結果を示す研究ほど英語で出版される傾向があり、非英語文献を除外すると効果量が過大評価される可能性
- 地域特有のエビデンスの欠落: 各国の医療システム、食文化、遺伝的背景に基づく研究は現地語で出版されることが多い
- 大規模データの見落とし: 中国語圏の臨床研究は膨大であり、英語データベースにインデックスされていないものが多数
Cochrane Handbookでは、系統的レビューの検索において言語制限を設けないことを推奨しています。実際に言語制限を外すと、含まれる研究数が10-20%増加するケースが報告されています。
日本語医学文献の検索
医中誌Web
医中誌Web(ichushi.or.jp)は、日本最大の医学文献データベースです。約1,500万件以上の文献を収録しており、日本語論文の検索には不可欠です。
医中誌Webの特徴:
- 日本語のシソーラス(統制語)を使用
- PubMedのMeSHに相当する体系的な分類
- 抄録の日本語・英語両方を収録
- 看護、薬学、歯学等の幅広い領域をカバー
CiNii Research
CiNii Research(cir.nii.ac.jp)は国立情報学研究所が提供する学術情報検索サービスです。医学だけでなく、社会科学や人文科学の文献も含みます。
J-STAGE
J-STAGE(jstage.jst.go.jp)は科学技術振興機構(JST)が提供する日本の学術雑誌の電子ジャーナルプラットフォームです。多くの論文が全文無料で公開されています。
AIによる日本語検索式の生成
以下のPubMed検索式を、医中誌Web用の日本語検索式に変換してください。
PubMed検索式: [英語の検索式]
以下を含めてください:
- 医中誌シソーラス用語: 各MeSHに対応する医中誌の統制語
- フリーテキスト語: 日本語の同義語、略語、一般的な表現
- 医中誌Web形式の検索式: 完成した検索式
- 注意点: 英語検索式との対応が不完全な部分の説明
- 補完が必要な検索語: 日本特有の用語や概念
中国語医学文献の検索
CNKI(China National Knowledge Infrastructure)
CNKIは中国最大の学術データベースで、中国の医学雑誌をほぼ網羅しています。
WanFang Data
WanFangは中国の学位論文、学会抄録を含むデータベースです。
CQVIP
CQVIPは中国の中文科学技術雑誌をカバーするデータベースです。
中国語文献データベースへのアクセスは、機関契約が必要な場合が多いです。また、一部の中国発RCTについてはデータの信頼性に関する懸念が報告されています(Carlisleの2017年の分析等)。中国語文献を系統的レビューに含める際は、バイアスリスクの評価をより慎重に行ってください。
AIによる多言語文献の活用
翻訳ワークフロー
非英語論文を発見した後の翻訳ワークフローを示します。
アブストラクトの翻訳・評価
AIで日本語/中国語のアブストラクトを英語に翻訳し、組入基準との適合性を評価する。この段階で大部分の論文が除外される。
全文の確認
アブストラクトスクリーニングを通過した論文の全文を入手。日本語論文はJ-STAGE等で、中国語論文はCNKI等で全文PDFを取得。
AIによる全文翻訳・データ抽出
全文をAIで翻訳し、必要なデータ(PICO要素、結果、バイアスリスク情報)を構造的に抽出する。
翻訳の質の検証
重要な数値(サンプルサイズ、効果量、p値)は原文と照合して翻訳精度を確認する。統計テーブルの数値は翻訳ミスが起きにくいため、原文で確認可能。
以下の日本語/中国語の論文からデータを抽出してください。
[論文の全文テキストまたはアブストラクトを貼り付け]
以下を英語で抽出してください:
- Study Design: 研究デザイン
- Setting: 実施施設・国
- Participants: サンプルサイズ、組入基準、除外基準
- Intervention/Exposure: 介入内容
- Comparator: 比較対照
- Primary Outcome: 主要アウトカムの定義と結果(効果量、95%CI、p値)
- Secondary Outcomes: 副次アウトカムの結果
- Risk of Bias indicators: ランダム化方法、盲検化、脱落率
- Funding/COI: 資金源と利益相反
- Key Conclusions: 著者の主要結論
日本語/中国語の原文も併記してください(翻訳の検証用)。
韓国語・その他言語の文献
KoreaMed
KoreaMed(koreamed.org)は韓国の医学文献データベースで、英語のアブストラクトが付いていることが多いです。
LILACS
LILACS(Latin American and Caribbean Health Sciences Literature)はラテンアメリカ・カリブ海地域の医学文献データベースで、スペイン語・ポルトガル語の文献をカバーします。
Global Health(CAB Abstracts)
Global Healthは熱帯医学、公衆衛生、栄養学などの分野で、開発途上国の文献を幅広くカバーするデータベースです。
多言語検索の実践的注意点
1. 言語制限の明示
検索の方法論セクションで、言語制限の有無を明確に記載します。
- 「言語制限なし」: 全言語を検索対象とした
- 「英語・日本語に限定」: 理由を記載(例:レビュアーの言語能力)
- 「英語のみ」: 言語バイアスの可能性をLimitationsで議論
2. 翻訳の質保証
3. データベースのカバレッジ意識
| 地域 | 主要データベース | PubMedとの重複率 |
|---|---|---|
| 日本 | 医中誌Web, J-STAGE | 約40-60% |
| 中国 | CNKI, WanFang | 約20-30% |
| 韓国 | KoreaMed, KMbase | 約50-70% |
| ラテンアメリカ | LILACS | 約30-50% |
| 欧州(独語圏) | LIVIVO, DIMDI | 約60-80% |
この章のポイント
多言語文献検索は、系統的レビューの網羅性と言語バイアスの回避に不可欠です。AIの翻訳能力が飛躍的に向上した現在、言語の壁は以前ほど高くありません。医中誌Web、CNKI等の地域データベースとPubMedを組み合わせ、AIの翻訳・データ抽出機能を活用することで、多言語のエビデンスを体系的に統合できます。