2型糖尿病の新たなサブタイプ分類手法を開発 日常臨床データで4つのタイプに分類 千葉大学
日常臨床データだけで高精度な分類・予測が可能
千葉大学などは、日常的に得られる臨床データのみを用いて、2型糖尿病のサブタイプを高精度に予測できる機械学習モデルを開発したと発表した。
患者1人ひとりの合併症リスクや治療反応性を、同モデルと手持ちのデータから高精度に予測でき、臨床現場での糖尿病のサブタイプの予測、糖尿病の個別化医療実現に大きく寄与することが期待されるとしている。
観察期間前後のサブタイプ予測の結果を比べたところ、前後でサブタイプが一致していた割合は、重症インスリン欠乏性糖尿病(SIDD)は100%、重症インスリン抵抗性糖尿病(SIRD)は68.6%、軽度肥満関連糖尿病(MOD)は94.4%、加齢関連糖尿病(MARD)は97.9%となり、従来法よりも高い一貫性が示された。
機械学習の手法のひとつであるランダムフォレストに、欠損データの補綴と、予測確率の低い分類カテゴリー(分類不能群)の定義・追加を組み合わせることで、精度を高めた。
研究は、千葉大学大学院医学研究院の川上英良教授、福島県立医科大学糖尿病内分泌代謝内科学講座の田辺隼人助教、島袋充生教授らによるもの。研究成果は、「Diabetologia」に掲載された。
2型糖尿病を4つのサブタイプに高精度に分類・予測
先行研究では、2型糖尿病は「重症インスリン欠乏性糖尿病」「重症インスリン抵抗性糖尿病」「軽度肥満関連糖尿病」「加齢関連糖尿病」の4種類のサブタイプに分類されることが示されている。
病気の状態や原因、合併症の有無・種類、治療反応は個人で異なり、患者の糖尿病のサブタイプを知ったうえで、それに合わせた治療を進めることが重要となる。
2型糖尿病の分類には、個々の患者のインスリンの分泌・感受性に関連するデータが必要となるが、日常臨床データには含まれない項目のため、臨床現場で活用しにくいという課題があった。また、理論上は糖尿病のサブタイプは長期にわたり安定的と考えられているが、従来法での分類では経時的なサブタイプの変化がしばしば生じ、サブタイプ分類は長期的な治療計画には使いにくいと考えられていた。
そこで研究グループは、日常臨床データだけで2型糖尿病のサブタイプを高精度かつ一貫性をもって予測できるモデルの開発を試みた。
機械学習の手法であるランダムフォレストに、(1) 検査値間の関係を学習することで、日常臨床データの値からインスリンに関するデータの値の推定が可能にする欠損データの補綴、(2) 先行研究では4つだった2型糖尿病のカテゴリーに、分類予測確率の低いカテゴリー(分類不能群: UD)を定義・追加することで、各サブタイプの特徴量の分布が重ならずに分類・予測できるようにした。
これにより、日常的に得られる臨床データのみを用いて、2型糖尿病のサブタイプを高精度に予測できる機械学習モデルを開発した。
手持ちのデータから高精度に予測 精度は82.9~94.0%
新しいモデルによるサブタイプ予測は、教師データである従来法での分類結果に対し、82.9~94.0%という高い精度を示した。
またサブタイプ分類の一貫性の検討のため、観察期間前後のサブタイプ予測の結果を比較したところ、前後でサブタイプが一致していた割合は、▼重症インスリン欠乏性糖尿病(SIDD) 100%、▼重症インスリン抵抗性糖尿病(SIRD) 68.6%、▼軽度肥満関連糖尿病(MOD) 94.4%、▼加齢関連糖尿病(MARD) 97.9%となり、従来法よりも高い一貫性が示された。
「今回得られた予測モデルにより、従来必須であった項目が欠損していても日常臨床データを用いたサブタイプ分類が可能となり、患者一人ひとりの合併症リスク(失明、神経障害、脳卒中、心筋梗塞、腎不全など)や治療反応性を、手持ちのデータから高精度に予測できるようになった」と、研究グループでは述べている。
「本成果により、日常診療データからの糖尿病のサブタイプ予測が可能となり、臨床現場におけるサブタイプ分類、糖尿病の個別化医療実現への大きな寄与が期待される。また、一貫性の高いサブタイプ分類が可能となったことで、個々の患者の合併症リスクや治療反応性にもとづいた長期的な治療計画や予後の推定にも本モデルが貢献できると考えられる」としている。
千葉大学大学 国際高等研究基幹
Machine learning-based reproducible prediction of type 2 diabetes subtypes (Diabetologia 2024年8月21日)