血糖値が高めだとインフルエンザ罹患リスクが高い ビッグデータから罹患リスクの高いグループを分類 弘前大学・京都大学など
住民を対象とした大規模住民合同健診・健康指導を実施
弘前大学では、「岩木健康増進プロジェクト」を、2005年から実施してきた。青森県弘前市岩木地区の住民を対象とした大規模住民合同健診・健康指導などの健康調査で、2,000~3,000項目という世界に例のない膨大な検査項目を設けることで、超多項目健康ビッグデータを記録している。
弘前大学と大正製薬は2021年、共同研究講座「プレシジョンヘルスケア学講座」を開設した。共同研究講座では、同プロジェクトで得られた健康ビッグデータと研究知見を組み合わせて解析し、かぜ・毛髪・疲労に関連する症状と生体関連因子の関係性の解明を研究課題に、生活者によりそったソリューションの提供によって、予防や未病ケアを含めたトータルケアの実現を目指している。
しかし、健康ビッグデータ解析による病気の罹患リスクの高い特徴の特定にあたり、用いるデータが約3,000項目×数千、数万人と膨大なデータ量となるため、一般的な相関解析やクラスタリング手法を適用するだけでは、罹患リスクの特徴の抽出や、その関係性を把握するのは困難だった。
血糖値が高めの人などはインフルエンザ罹患リスクが高い
これら課題に対し、京都大学大学院の奥野恭史教授らおよび同共同研究講座との研究グループで検討を重ねた結果、健康ビッグデータから病気の罹患リスクの高い特徴的なグループ(体質・生活習慣・環境等)を抽出できる、独自の層別解析手法を構築した。
同手法の構築は、岩木健康増進プロジェクト2019年度健診データ(全1,062人、内1年以内のインフルエンザ罹患あり121人)を用いて、インフルエンザ罹患をモデルとして実施し、解析の手順は以下の3つのステップを経て行った。
(1) 関連因子の抽出
機械学習によってビッグデータから病気の罹患に関連する因子を選抜する
(2) 因果関係の解析
(1)で得られた因子について、因果分析手法のひとつであるベイジアンネットワーク解析により、因果関係をモデル化する
(3) タイプ分類
(2)で得られたネットワーク解析結果を活用した階層クラスタリングにより、病気の罹患リスクの高い特徴的なグループに分類する
その結果、インフルエンザ罹患リスクの高い特徴的なグループとして、血糖値が高めのグループ、肺炎歴があるグループ、睡眠状況が悪いグループなどの存在が示唆された。
これら特徴の多くは、インフルエンザを含む上気道感染症の罹患要因に関する先行研究と整合性がとれており、同手法は有用であると考えられるという。
体質や健康リスクに寄り添った効果的な治療・予防を
「今回、インフルエンザをモデルとして、健康ビッグデータ解析によって病気の罹患リスクが高い特徴的なグループを見出すことが可能であることを確認いたしました。今回1年間のデータを使用して解析を行いましたが、今後も多年度の健康ビッグデータの蓄積および解析手法の改良・検証を重ねて参ります」と、研究グループでは述べている。
「さらには、かぜの罹患しやすさ、薄毛や白髪の要因、日常生活での疲労などに本手法を応用することで、体質や健康リスクに寄り添った効果的な治療・予防に関する新たな知見を見出すとともに、研究成果を活用したソリューションの提供により、健康と美を願う生活者のより豊かな暮らしの実現に貢献して参ります」としている。
岩木健康増進プロジェクト (弘前大学COI研究推進機構)
京都大学大学院医学研究科人間健康科学系専攻ビッグデータ医科学分野
第4回日本メディカルAI学会学術集会