臨床研究者のゲノム研究 ─ GWASの活かし方
GWASの基本から、ポリジェニックリスクスコア(PRS)やメンデリアンランダマイゼーション(MR)といった応用手法まで、臨床研究者がゲノム研究を活かすための実践的ガイドを解説します。
GWASから広がる応用研究:PRSとMR
ゲノムワイド関連解析(GWAS)が初めて報告されてから20年以上が経ち、現在では基礎研究者だけでなく臨床研究者にも広く浸透した手法となりました。GWASの本質はシンプルで、ゲノム全体の遺伝子変異を網羅的に検索し、疾患や形質との関連を探索する「総当たり」型の泥臭いアプローチにあります。ただし実施には、参加者のリクルートからサンプル処理・遺伝子型決定・大規模データ解析に至るまで、多大な人的・資金的コストが必要です。そのため多くのコンソーシアムやバイオバンクは、設立当初からGWASを最優先課題として掲げ、データ取得後すぐに解析を進めています。一方で、臨床研究者や疫学者が自らGWASを行う機会は限られているのが実情です。
しかし臨床研究者・疫学者にとって、GWASは「結果を眺めて理解する」だけの手法ではありません。得られた膨大な情報を起点に、臨床的知識が大きく生かされる二次解析のフィールドが広がっています。本稿ではまずGWASの概要を概観し、続いてポリジェニックリスクスコア(PRS)とメンデリアンランダマイゼーション(MR)の二つの応用手法を取り上げ、臨床研究における活用可能性を解説します。
GWASのキホン
基本的なGWASは、Genotyping Arrayで取得した常染色体のおよそ100万個のSNPを対象に、疾患や形質との関連を網羅的に調べる手法です。研究によっては性染色体を含めることもありますが、ミトコンドリアDNAが解析に組み込まれるケースはまれです。多くの研究ではこの後、インピュテーション(参照パネルを用いて未観測変異を推定する手続き)を行い、数千万規模(SNPと一部のindelを含む)の変異で関連解析を実施します。さらに全ゲノムシーケンス(WGS)を用いれば、低頻度の変異やコピー数多型(CNV)など構造多型まで解析対象を拡張できます。対象変異の性質や統計モデルは変わりますが、ゲノム全体を横断的に検定するというGWASの根幹コンセプトは共通です。こうして得られたGWASサマリー統計は、「Post-GWAS」と総称される二次解析の出発点となります。PRSやMRは代表例で、主に常染色体SNPのGWAS結果を利用して疾患リスク予測や因果推論を行います。
PRS ─ リスク予測
PRSは、個人のゲノム情報から推定する疾患リスク指標です。考え方はシンプルで、例えばSNP1がリスク1.1倍、SNP2が0.9倍……といったように、各SNPの効果量(オッズ比やβ係数)が推定されていれば、個人の遺伝型に合わせてそのリスクを足し合わせていけば、個人の総リスクが算出できます。ここで用いる効果量は、過去に公開されたGWASサマリー統計から取得します。したがってPRSを計算するのに必要なのは、①対象疾患のGWASサマリー統計と、②リスクを推定したい集団のゲノムデータの2点だけです。サマリー統計には個人データは含まれないため、世界中の大規模コンソーシアムやバイオバンクがウェブ上で無償公開していることが多く、臨床研究者でも手軽に利用できます。
疫学研究でよく用いられる家族歴と似た概念に思えますが、以下の点で異なります。このような違いから、「PRSと家族歴のどちらが有用か」という議論が活発に行われていますが、臨床・公衆衛生の文脈によって求められる指標は変わるため、両者を補完的に活用するアプローチが現在注目されています。
PRS vs. 家族歴
| 項目 | PRS | 家族歴 |
|---|---|---|
| 変数の形 | 連続変数 | カテゴリー変数 |
| 対象疾患 | 先行研究でGWASが実施され、サマリー統計が入手できる疾患 | 頻度の高い一般的な疾患 |
| ゲノムデータ | 必要 | 不要 |
| 家族構成への依存 | なし | あり |
| 生活習慣の影響 | 純粋に遺伝 | 生活習慣などの家族で共有する要素の影響を受ける |
| 民族・祖先性 | GWASが盛んなヨーロッパ集団において高精度 | 差はない |
MR ─ 因果推論
MRは、二つの独立したGWASサマリー統計だけで「曝露(表現型A)がアウトカム(表現型B)に及ぼす因果効果」を推定する、遺伝子変異を用いた操作変数法です。手順はシンプルで、まず各SNPについて①SNP→疾患Aの効果量、②SNP→疾患Bの効果量を取得し、両者の比(Wald比)をとることで疾患A→疾患Bの因果効果を計算します。必要なのは、(1) 疾患A用GWASサマリー統計と、(2) 疾患B用GWASサマリー統計の二つのみで、解析者は公開サマリーをダウンロードするだけでよく、個人のデータを直接扱う必要はありません。注意点としては、二つのGWASサマリー統計について、①GWASのサンプルが重複しないこと、②民族・祖先性が一致していること、が推奨されます。欧州では公開GWASが豊富なためMR研究が先行していますが、近年は東アジア、とくに日本でも大規模バイオバンクが整備されつつあり、同じ手法で新たなエビデンスを創出する動きが加速しています。