遺伝子とリスク予測
妊娠高血圧腎症の発症リスクを、妊婦とそのパートナーの遺伝的リスクまで加味して予測する論文を発表しました。妊娠高血圧腎症の発症リスク予測モデルの開発には、かれこれ五年間(計三論文)取り組んできましたが、本論文は「遺伝情報」という新領域に踏み出した、世界に先駆ける研究成果となりました。予防医学を目指すうえで、個人の遺伝的体質は避けて通れない必須要素であり、今後もさまざまな分野で応用されることを願っています。
研究の原点、「なぜ予測するのか」
さて、本論文は自分の研究の一区切りとなるものでしたが、常に頭を悩ませていた問いがあります──「なぜ疾患発症リスクを予測する必要があるのか?」。データを扱っていると、ある意味で本能的に「予測」したくなるもので、私の研究のスタートもその本能に導かれたものでした。しかし、当時医学部生だった私には、妊娠高血圧腎症の予測モデルが産科領域でなぜそこまで重要視されるのか、理解できていませんでした。それでも先行研究で数多くの予測モデルが報告されている事実は、そこに何らかの意義があることを示しています。
疫学研究の主流──因果推論という考え方
疫学研究のメインストリームは、因果推論(causal inference)に基づく研究です。予測モデルを主題とする論文は、臨床よりもデータサイエンス寄りのものが多く、臨床論文では因果推論の“おまけ”的に扱われることもしばしばです。因果推論研究の核心は「もしこの暴露・介入がなかったら(あったら)どうなるか」を問うことにあります。これは臨床での意思決定や医療政策の策定に直結する重要なリサーチテーマです。たとえば「この投薬で血圧が 5 mmHg 下がる」「軽い運動でも循環器疾患リスクが3%減る」といった知見は、直感的に臨床の場で役立つと想像できます。
リスク予測と因果推論の違い
では予測モデルはどうでしょう。個人のリスクが分かれば臨床は変わるのでしょうか?多くの場合、予測モデルの臨床応用はハードルが高いです。とくに頻繁に見かける誤解は、予測モデルで介入効果を論じてしまうことです。
例を挙げます。肺がん発症リスク予測モデルを作成し、基礎特性・喫煙状況・血清サイトカイン値を変数に用いたとします。ある喫煙者の 10 年後リスクが 5 %と推定されました。ここで喫煙状況を「喫煙なし」に書き換えたところ、モデルはリスクを 4 %と更新しました。この 1 %差は「禁煙でリスクが 1 %減る」ことを意味しません。禁煙に伴うサイトカイン値の変動などがモデルに反映されておらず、実際の介入状況とは異なるからです。リスク予測的なアプローチは一部を除き(g-methodなど)、因果推論の原則を破っています。要するに、介入効果を知りたいなら最初から因果推論アプローチを採るべきで、予測モデルの回帰係数や寄与度を介入効果とみなしてはいけません。
リスク予測が意味を持つとき
私の理解する予測モデルの意義とは以下の3点に集約されます。
- 疾患リスクを提示することで、個人の行動変容が見込まれるとき
- 疾患リスクに応じて医療介入が変わるとき
- 疾患リスクが医療政策を左右するとき
つまり、患者・医療者・為政者がリスク情報に基づいて意思決定を変えるかどうかです。それぞれに前提条件があり、詳細は次回以降で掘り下げます。

この記事は、疫学者の独り言として、疫学者の頭の中をそのまま書きだしたものです。教科書ほど厳密でも、論文ほど専門的でもありません。ただ、「疫学者はこのくらいの理解で研究をしているのか」と参考にしていただければ幸いです。誤りやご意見がありましたら、コメントをいただけるとうれしいです。議論を通じて、読者と私自身の理解を深めていきたいと思います。
コメントを残す