腎疾患を高精度に解析するAIを開発 糸球体画像から腎疾患を効率的に分類 大阪大学など
腎疾患分類を少ないラベルつきデータから効率的に行うAIを開発
糸球体画像疾患分類に機械学習を活用
大阪大学は、腎疾患分類を少ないラベルつきデータから効率的に行うAIを開発したと発表した。腎糸球体画像疾患分類に、機械学習の手法のひとつである自己教師あり学習を活用することで、人間の指示なしで、腎病理画像の重要な組織学的特徴の抽出が可能になった。
このAIは、糸球体内の構成要素を色分けして可視化でき、ラベル情報なしで形態学的な違いを学習する能力がある。
さらに、このモデルを用いて腎疾患を分類した結果、従来の手法を超える性能を達成した。とくにラベル付きデータが少ない場合にも高い性能を維持した。
これまで、腎病理画像解析AIの開発には、大量のラベル付きデータにもとづく学習が必要であり、大規模なデータセット作成が困難であることが課題となっていた。
研究グループは今回、大阪大学医学部附属病院腎臓内科で腎生検を受けた384例のPAS染色画像中の1万423枚の糸球体画像に、自己教師あり学習の手法のひとつであるDINO(self-distillation with no labels)を適応した。
DINO学習済みモデルによって生成された特徴マップを可視化するために主成分分析(PCA)を用いると、糸球体の構成要素ごとに色が分かれ、異なる組織には異なる主成分の要素が強く出ていることが確認された。
PCAは、多数の変数をもつデータからもっとも重要な情報を抽出し、より少ない新しい変数(主成分)に要約する統計手法で、データの解釈を容易にする。
研究グループはさらに、DINO学習済みモデルまたは従来のImageNet学習済みモデルを用いて分類タスクを学習させ、受信者動作特性曲線下面積(ROC_AUC)などの指標を用いて性能を評価した。
分類タスクとして、▼微小糸球体病変、▼メサンギウム増殖性糸球体腎炎、▼膜性腎症、▼糖尿病性腎症の4疾患分類と、▼高血圧、▼タンパク尿、▼血尿などの臨床パラメータ分類の2つを用いた。
その結果、疾患分類では、DINO学習済みモデル(ROC_AUC=0.934)が、ImageNet学習済みモデル[ROC_AUC 0.892]を上回った。ラベル付きデータが制限された場合、ImageNet学習済みモデルはROC_AUCが0.763[95%信頼区間 0.724~0.802]に低下したが、DINO学習済みモデルは優れた性能を維持した[ROC_AUC 0.882、95%信頼区間 0.862~0.903]。DINO学習済みモデルはいくつかの臨床パラメータでも、より高いROC_AUCを示した。
研究は、大阪大学医学部医学科の安部政俊氏、九州大学データ駆動イノベーション推進本部の新岡宏彦教授、大阪大学大学院医学系研究科の松井功氏、猪阪善隆教授(腎臓内科学)らの研究グループによるもの。研究成果は、「Journal of the American Society of Nephrology」にオンライン掲載された。
「本研究では、自己教師あり学習を腎糸球体分類に適応することで、最小限のラベル付けでも高い性能で疾患分類を行うことができることを示した。自己教師あり学習を用いることで、デジタル病理学での深層学習の応用の効率化が進み、さらなる発展を遂げることが期待される」と、研究者は述べている。
大阪大学医学系研究科・医学部
Self-Supervised Learning for Feature Extraction from Glomerular Images and Disease Classification with Minimal Annotations (Journal of the American Society of Nephrology 2024年10月9日)