GWASから広がる応用研究:PRSとMR
ゲノムワイド関連解析(GWAS)が初めて報告されてから20年以上が経ち、現在では基礎研究者だけでなく臨床研究者にも広く浸透した手法となりました。GWASの本質はシンプルで、ゲノム全体の遺伝子変異を網羅的に検索し、疾患や形質との関連を探索する「総当たり」型の泥臭いアプローチにあります。ただし実施には、参加者のリクルートからサンプル処理・遺伝子型決定・大規模データ解析に至るまで多大な人的・資金的コストが必要です。そのため多くのコンソーシアムやバイオバンクは、設立当初からGWASを最優先課題として掲げ、データ取得後すぐに解析を進めています。一方で、臨床研究者や疫学者が自らGWASを行う機会は限られているのが実情です。
しかし臨床研究者・疫学者にとって、GWASは「結果を眺めて理解する」だけの手法ではありません。得られた膨大な情報を起点に、臨床的知識が大きく生かされる二次解析のフィールドが広がっています。本稿ではまずGWASの概要を概観し、続いてポリジェニックリスクスコア(PRS)とメンデリアンランダマイゼーション(MR)の二つの応用手法を取り上げ、臨床研究における活用可能性を解説します。
GWASのキホン
基本的な GWAS は、Genotyping Array で取得した 常染色体のおよそ 100 万個の SNP を対象に、疾患や形質との関連を網羅的に調べる手法です。研究によっては 性染色体 を含めることもありますが、ミトコンドリア DNA が解析に組み込まれるケースはまれです。多くの研究ではこの後、インピュテーション(参照パネルを用いて未観測変異を推定する手続き)を行い、数千万規模(SNP と一部の indel を含む) の変異で関連解析を実施します。さらに 全ゲノムシーケンス(WGS) を用いれば、低頻度の変異やコピー数多型(CNV)など 構造多型 まで解析対象を拡張できます。対象変異の性質や統計モデルは変わりますが、ゲノム全体を横断的に検定する という GWAS の根幹コンセプトは共通です。
こうして得られたGWAS サマリー統計は、「Post-GWAS」と総称される二次解析の出発点となります。PRSやMRは代表例で、主に常染色体SNPのGWAS結果を利用して疾患リスク予測や因果推論を行います。
PRS ─ リスク予測
PRSは、個人のゲノム情報から推定する疾患リスク指標です。考え方はシンプルで、例えば SNP1 がリスク 1.1 倍、SNP2 が 0.9 倍 …といったように、各 SNP の効果量(オッズ比や β 係数)が推定されていれば、個人の遺伝型に合わせてそのリスクを足し合わせていけば、個人の総リスクが算出できます。ここで用いる効果量は、過去に公開された GWAS サマリー統計 から取得します。したがって PRS を計算するのに必要なのは ①対象疾患の GWAS サマリー統計 と ②リスクを推定したい集団のゲノムデータ の 2 点だけです。サマリー統計には個人データは含まれないため、世界中の大規模コンソーシアムやバイオバンクがウェブ上で無償公開していることが多く、臨床研究者でも手軽に利用できます。
疫学研究でよく用いられる家族歴と似た概念に思えますが、以下の点で異なります。このような違いから、「PRS と家族歴のどちらが有用か」という議論が活発に行われていますが、臨床・公衆衛生の文脈によって求められる指標は変わるため、両者を補完的に活用するアプローチが現在注目されています。
PRS vs. 家族歴
PRS | 家族歴 | |
変数の形 | 連続変数 | カテゴリー変数 |
対象疾患 | 先行研究でGWASが実施 され、サマリー統計が入手できる疾患 | 頻度の高い一般的な疾患 |
ゲノムデータ | 必要 | 不要 |
家族構成への依存 | なし | あり |
生活習慣の影響 | 純粋に遺伝 | 生活習慣などの家族で共有する要素の影響をうける |
民族・祖先性 | GWASが盛んなヨーロッパ集団において高精度 | 差はない |
MR ─ 因果推論
MRは、二つの独立した GWAS サマリー統計だけで「曝露(疾患 A)がアウトカム(疾患 B)に及ぼす因果効果」を推定する、遺伝子変異を用いた操作変数法です。手順はシンプルで、まず各 SNP について ① SNP→疾患 A の効果量、② SNP→疾患 B の効果量を取得し、両者の比(Wald 比)をとることで疾患 A→疾患 B の因果効果を計算します。必要なのは (1) 疾患 A 用 GWAS サマリー統計と (2) 疾患 B 用 GWAS サマリー統計の二つのみで、解析者は公開サマリーをダウンロードするだけでよく、個人のデータを直接扱う必要はありません。注意点としては、2つのGWASサマリー統計について、①GWASのサンプルが重複しない ②民族・祖先性が一致していること、が推奨されます。欧州では公開GWASが豊富なためMR 研究が先行していますが、近年は東アジア、とくに日本でも大規模バイオバンクが整備されつつあり、同じ手法で新たなエビデンスを創出する動きが加速しています。
コメントを残す