AIで高血圧および糖尿病の新規発症を予測する
第46回日本高血圧学会総会
シンポジウム18「AI活用の血圧および健康評価へ」
●開催日:2024年10月13日
●演題:「大規模健診データを基にした高血圧および糖尿病の新規発症を予測する機械学習/AIモデルの構築」
●演者:田中希尚 先生
(札幌医科大学循環器・腎臓・代謝内分泌内科学講座)
共同演者:古橋眞人 先生
(札幌医科大学循環器・腎臓・代謝内分泌内科学講座 教授)
AIによる予測は生活習慣病の評価と保健指導に有用である
近年、機械学習/Artificial Intelligence (AI)モデルの社会実装、そして医療分野への応用が進んでいる。第46回日本高血圧学会総会シンポジウムにて、札幌医科大学循環器・腎臓・代謝内分泌内科学講座の田中希尚氏と古橋眞人氏は、大規模健診データを用いて、高血圧および糖尿病の新規発症を高精度に予測する機械学習モデルの構築について講演した。
これまでに、Fatty Liver Index (FLI)の高値が高血圧、糖尿病、慢性腎臓病、心不全、虚血性心疾患の発症と関連していることはデータ分析にて明らかになっている。
FLIはBMI、γGTP、中性脂肪、腹囲といった簡便かつ非侵襲的に測定可能な項目から算出され、脂肪肝の評価に用いられている指標である。
田中氏らは、このFLIを含む58因子の健診データを基に、AIを用いて高血圧および糖尿病の新規発症予測モデルの構築について研究を行った。
まず、高血圧発症の予測についての検討が行われた。対象者は札幌市の渓仁会円山クリニックで2006年に健診を受けた28,990名のうち、高血圧症例およびデータの欠損がある例を除外した15,965名であり、10年間にわたり追跡調査が実施された。
Randomforest(機械学習モデルのひとつ)を用いた特徴量の選択(Feature selection)を行ったところ、収縮期血圧、拡張期血圧、FLI、年齢が重要な特徴量として抽出されたが、各機械学習モデルの項目同士の関連性を考慮して拡張期血圧を除き、収縮期血圧、FLI、年齢で構成した。
また、収縮期血圧、年齢に加え、FLIの構成要素であるγGTP、BMI、腹囲、中性脂肪で構成したモデルにおいても同様に検証することとした。
これらの特徴量を基に、Logistic regression、Random Forest、Naïve Bayes、Extreme Gradient Boosting、Artificial Neural Networkの各機械学習モデルを構築し、それぞれの予測精度を検証した結果は以下となった。
収縮期血圧、FLI、年齢で構成された5つの機械学習モデルは、AUCが0.765~0.825、Accuracyが0.801~0.828と、いずれも高精度な高血圧発症予測能を示した。
また、収縮期血圧、年齢とγGTP、BMI、腹囲、中性脂肪を用いたモデルにおいても、AUCが 0.799~0.822、Accuracyが0.885~0.828と、前者と同程度に高精度な予測が可能であることが確認された。
上記いずれの場合でも、Artificial Neural Networkが最も優れた予測能を有していた。
次に、糖尿病発症の予測についても同様の手法で検討が行われた。対象者は登録時の糖尿病症例とデータ欠損例を除外した10,248名で、10年間の追跡調査を行った。
Randomforestを用いたFeature selectionにより重要な特徴量を抽出し、Logistic regression、Naïve Bayes、Extreme Gradient Boosting、Artificial Neural Networkの各機械学習モデルの糖尿病発症予測精度を検証した。
重要な特徴量として、HbA1c、血糖値、FLIが選択されたが、項目同士の関連性を考慮し、HbA1cまたは血糖値にFLI を加えて各機械学習モデルを構築した。また、BMI、γGTP、中性脂肪、腹囲と、HbA1cまたは血糖値の特徴量で構成された機械学習モデルでも検証を行った。
結果、HbA1cまたは血糖値とFLIで構成された4つの機械学習モデルはいずれもAUCが0.827~0.875、Accuracyが0.956~0.963と、高精度な予測能を有していた。
また、BMI、γGTP、中性脂肪、腹囲と、HbA1cまたは血糖値で構成された機械学習モデルも、AUCが0.816~0.873、Accuracyが0.936~0.916と、前者と同程度に高度な予測能を有することが確認された。
以上の結果から、高血圧発症においては収縮期血圧、年齢、FLI、糖尿病発症においてはHbA1cもしくは血糖値と、FLI で構成される機械学習モデルによって高精度に発症の予測が可能であることがわかった。
簡便かつ非侵襲的な算出が可能なFLIを用いた機械学習モデルの構築は、住民健診や実臨床における生活習慣病の評価と保健指導に有用であり、将来的には生活習慣病の予防や早期介入に貢献することが期待される。