多言語文献検索（英語・日本語・中国語）

言語バイアスという見えないリスク

医学研究の世界では英語が共通語ですが、全世界の医学文献の約30%は英語以外で出版されています。系統的レビューにおいて英語文献のみを検索することは 言語バイアス（language bias） を引き起こします。

言語バイアスの具体的なリスクは以下の通りです。

出版バイアスの増幅: 有意な結果を示す研究ほど英語で出版される傾向があり、非英語文献を除外すると効果量が過大評価される可能性
地域特有のエビデンスの欠落: 各国の医療システム、食文化、遺伝的背景に基づく研究は現地語で出版されることが多い
大規模データの見落とし: 中国語圏の臨床研究は膨大であり、英語データベースにインデックスされていないものが多数

Cochrane Handbookでは、系統的レビューの検索において言語制限を設けないことを推奨しています。実際に言語制限を外すと、含まれる研究数が10-20%増加するケースが報告されています。

日本語医学文献の検索

医中誌Web

医中誌Web（ichushi.or.jp）は、日本最大の医学文献データベースです。約1,500万件以上の文献を収録しており、日本語論文の検索には不可欠です。

医中誌Webの特徴：

日本語のシソーラス（統制語）を使用
PubMedのMeSHに相当する体系的な分類
抄録の日本語・英語両方を収録
看護、薬学、歯学等の幅広い領域をカバー

CiNii Research

CiNii Research（cir.nii.ac.jp）は国立情報学研究所が提供する学術情報検索サービスです。医学だけでなく、社会科学や人文科学の文献も含みます。

J-STAGE

J-STAGE（jstage.jst.go.jp）は科学技術振興機構（JST）が提供する日本の学術雑誌の電子ジャーナルプラットフォームです。多くの論文が全文無料で公開されています。

AIによる日本語検索式の生成

プロンプト

以下のPubMed検索式を、医中誌Web用の日本語検索式に変換してください。

PubMed検索式: [英語の検索式]

以下を含めてください：

医中誌シソーラス用語: 各MeSHに対応する医中誌の統制語
フリーテキスト語: 日本語の同義語、略語、一般的な表現
医中誌Web形式の検索式: 完成した検索式
注意点: 英語検索式との対応が不完全な部分の説明
補完が必要な検索語: 日本特有の用語や概念

中国語医学文献の検索

CNKI（China National Knowledge Infrastructure）

CNKIは中国最大の学術データベースで、中国の医学雑誌をほぼ網羅しています。

WanFang Data

WanFangは中国の学位論文、学会抄録を含むデータベースです。

CQVIP

CQVIPは中国の中文科学技術雑誌をカバーするデータベースです。

中国語文献データベースへのアクセスは、機関契約が必要な場合が多いです。また、一部の中国発RCTについてはデータの信頼性に関する懸念が報告されています（Carlisleの2017年の分析等）。中国語文献を系統的レビューに含める際は、バイアスリスクの評価をより慎重に行ってください。

AIによる多言語文献の活用

翻訳ワークフロー

非英語論文を発見した後の翻訳ワークフローを示します。

アブストラクトの翻訳・評価

AIで日本語/中国語のアブストラクトを英語に翻訳し、組入基準との適合性を評価する。この段階で大部分の論文が除外される。

全文の確認

アブストラクトスクリーニングを通過した論文の全文を入手。日本語論文はJ-STAGE等で、中国語論文はCNKI等で全文PDFを取得。

AIによる全文翻訳・データ抽出

全文をAIで翻訳し、必要なデータ（PICO要素、結果、バイアスリスク情報）を構造的に抽出する。

翻訳の質の検証

重要な数値（サンプルサイズ、効果量、p値）は原文と照合して翻訳精度を確認する。統計テーブルの数値は翻訳ミスが起きにくいため、原文で確認可能。

プロンプト

以下の日本語/中国語の論文からデータを抽出してください。

[論文の全文テキストまたはアブストラクトを貼り付け]

以下を英語で抽出してください：

Study Design: 研究デザイン
Setting: 実施施設・国
Participants: サンプルサイズ、組入基準、除外基準
Intervention/Exposure: 介入内容
Comparator: 比較対照
Primary Outcome: 主要アウトカムの定義と結果（効果量、95%CI、p値）
Secondary Outcomes: 副次アウトカムの結果
Risk of Bias indicators: ランダム化方法、盲検化、脱落率
Funding/COI: 資金源と利益相反
Key Conclusions: 著者の主要結論

日本語/中国語の原文も併記してください（翻訳の検証用）。

韓国語・その他言語の文献

KoreaMed

KoreaMed（koreamed.org）は韓国の医学文献データベースで、英語のアブストラクトが付いていることが多いです。

LILACS

LILACS（Latin American and Caribbean Health Sciences Literature）はラテンアメリカ・カリブ海地域の医学文献データベースで、スペイン語・ポルトガル語の文献をカバーします。

Global Health（CAB Abstracts）

Global Healthは熱帯医学、公衆衛生、栄養学などの分野で、開発途上国の文献を幅広くカバーするデータベースです。

多言語検索の実践的注意点

1. 言語制限の明示

検索の方法論セクションで、言語制限の有無を明確に記載します。

「言語制限なし」: 全言語を検索対象とした
「英語・日本語に限定」: 理由を記載（例：レビュアーの言語能力）
「英語のみ」: 言語バイアスの可能性をLimitationsで議論

2. 翻訳の質保証

BeforeAfter

3. データベースのカバレッジ意識

地域	主要データベース	PubMedとの重複率
日本	医中誌Web, J-STAGE	約40-60%
中国	CNKI, WanFang	約20-30%
韓国	KoreaMed, KMbase	約50-70%
ラテンアメリカ	LILACS	約30-50%
欧州（独語圏）	LIVIVO, DIMDI	約60-80%

この章のポイント

多言語文献検索は、系統的レビューの網羅性と言語バイアスの回避に不可欠です。AIの翻訳能力が飛躍的に向上した現在、言語の壁は以前ほど高くありません。医中誌Web、CNKI等の地域データベースとPubMedを組み合わせ、AIの翻訳・データ抽出機能を活用することで、多言語のエビデンスを体系的に統合できます。