AIは医療現場で使えるか？　生成AIの診断能力は非専門医と同等であることが判明　大阪公立大学

2025.04.22

　生成AIに実際の医療現場で利用できる診断能力があるのか、医師との比較ではどうかを包括的な分析した大阪公立大学の研究で、生成AIの平均診断精度は52.1%で、医師全体と有意差がなく、非専門医との差もわずかであることが示された。

　ただし、専門医は生成AIよりも診断精度が15.8%高く、有意差があった。生成AIは専門医の完全な代替とはならないが、医学教育や非専門医の診断支援などでの活用は期待できるとしている。

　研究グループは、医療分野での生成AIの診断能力に関する研究論文83報について系統的レビューとメタ解析を実施。

生成AIと医師の診断能力を比較　非専門医とは同等の精度であると判明

　研究は、大阪公立大学大学院医学研究科放射線診断学・IVR学の田北大昂氏、人工知能学の植田大樹准教授らの研究グループによるもの。研究成果は、「npj Digital Medicine」にオンライン掲載された。

　近年、ChatGPTに代表される生成AIが医療分野でも注目されている。AIは適切に活用すれば医療の質の向上にも貢献できる可能性はあるものの、現状ではさまざまな課題がある。

　これまでに生成AIの診断能力に関する研究論文は多数発表されているが、それぞれ評価基準が違うため、実際の医療現場で利用できる診断能力がどの程度あるのか、医師との比較でどのような特徴があるのかなど、包括的な分析は行われていなかった。

　そこで研究グループは今回、医療に関する生成AIの診断能力について2018年6月～2024年6月に発表された83報の研究論文を用いて系統的レビューとメタ解析を実施。

　その結果、生成AIの平均診断精度は52.1%で、医師全体の方が9.9%高いものの有意差はなく、非専門医との差は、非専門医の方が0.6%高いもののわずかであることが示され、とくに生成AIの最新モデルについては、有意差はないものの、非専門医と同等以上の診断精度を示す場合もあった。

　ただし、専門医は生成AIよりも診断精度が15.8%高く、有意差があった。生成AIは専門医の完全な代替とはならないが、医学教育での活用や非専門医の診断支援、医療資源の限られた地域での診断補助などでの活用は期待できるとしている。

　研究グループによる、生成AIの医療に関する診断能力についての分析対象の対象となった83件の研究論文で多かったのはGPT-4(54件)とGPT-3.5(40件)で、その他にはGPT-4o、Claude 3、Gemini 1.5 pro、Llama 3 70Bなどの最新モデルも含まれていた。

　評価された医療分野は、一般内科が27件と最も多く、次いで放射線科が16件、眼科が11件、救急医療が8件など、多岐にわたった。

　「今後は、より複雑な臨床シナリオでの評価や実際の医療記録を用いた性能評価、AIの判断根拠の透明性向上、多様な患者群での検証など、さらなる研究が必要」と、研究者は指摘している。

大阪公立大学大学院医学研究科
 A systematic review and meta-analysis of diagnostic performance comparison between generative AI and physicians (npj Digital Medicine 2025年3月22日)

[ TERAHATA / 日本医療・健康情報研究所 ]

糖尿病・内分泌プラクティスWeb 糖尿病・内分泌医療の臨床現場をリードする電子ジャーナル

特集糖尿病関連腎臓病－現在の課題とその対策―

糖尿病関連腎臓病の概念と定義病態多様性低栄養とその対策他

特集ライフステージごとの内分泌代謝疾患－人生100年時代を謳歌するために－

小児・思春期1型糖尿病　成人期を見据えた診療看護師からの指導・支援小児がんサバイバーの内分泌診療女性の更年期障害とホルモン補充療法男性更年期障害（LOH症候群）他

セミナー【多職種連携必携キー・ノート】

神経障害糖尿病性腎症服薬指導－短時間で患者の心を掴みリスク回避多職種連携による肥満治療妊娠糖尿病運動療法進化する1型糖尿病診療糖尿病スティグマとアドボカシー活動糖尿病患者の足をチーム医療で守る外国人糖尿病患者診療他

セミナー【エビデンスでみる糖尿病・内分泌疾患】

インクレチン（GLP-1・GIP/GLP-1）受容体作動薬 SGLT2阻害薬 NAFLD/NASH 糖尿病と歯周病肥満の外科治療骨粗鬆症脂質異常症がんと糖尿病クッシング症候群甲状腺結節原発性アルドステロン症他

特集最適な糖尿病食事療法を探る－エビデンスと病態生理からの新機軸－

エネルギー設定の仕方 3大栄養素の量と質高齢者の食事療法食欲に対するアプローチ糖尿病性腎症の食事療法他

セミナー【研修道場ポイントはここだ！】

糖尿病薬を処方する時に最低限注意するポイント（経口薬） GLP-1受容体作動薬インスリン糖尿病関連デジタルデバイス骨粗鬆症治療薬二次性高血圧 1型糖尿病のインスリンポンプとCGM 他

AIは医療現場で使えるか？　生成AIの診断能力は非専門医と同等であることが判明　大阪公立大学

糖尿病・内分泌プラクティスWeb 糖尿病・内分泌医療の臨床現場をリードする電子ジャーナル

医薬品・医療機器・検査機器

経口薬

注射薬

医療機器・検査機器

【おすすめ】腎臓病の特集コーナー「慢性腎臓病とSDM」を開設しました！

Amazonギフトカード3000円分贈呈「糖尿病看護のあるある体験談」募集中！

早見表（インスリン製剤・血糖記録アプリ）最新版を販売中！

最新ニュース記事

SDMについてをまとめたコンテンツ『現代医療の必須ワード　SDMって何？』を公開

【米国糖尿病学会】月1回注射の肥満症治療薬を開発　第2相試験は有望な結果に

【米国糖尿病学会】GLP-1受容体作動薬が末梢動脈疾患(PAD)を改善し歩行能力を向上

【米国糖尿病学会】GLP-1受容体作動薬による筋肉減少を防ぐ　高齢者の筋肉量を維持

【米国糖尿病学会】スタチンなどの脂質低下薬の使用が不十分　何万件もの心筋梗塞・脳卒中を回避

「学び直す糖尿病・内分泌の薬理学」のご紹介【糖尿病・内分泌プラクティスWeb】

糖尿病の眼疾患の合併リスクは血糖管理が不十分の高齢患者では3倍に上昇

体温低下がインスリン抵抗性と糖尿病に似た代謝異常を引き起こす　生理学研究所など

よく読まれている記事

関連情報・資料

論考百選　-エキスパートたちの視点-

学会レポート

慢性腎臓病とSDM～life goalsと療法選択～

糖尿病治療に役立つ情報をお届けするDexcom Express

肥満症認知向上プログラム【セミナーレポート】

医療スタッフのギモンにこたえるグリコアルブミンQ&A

糖尿病ネットワーク

国際糖尿病支援基金

糖尿病・内分泌プラクティスWeb 糖尿病・内分泌医療の臨床現場をリードする電子ジャーナル

医薬品・医療機器・検査機器

経口薬

注射薬

医療機器・検査機器

【おすすめ】腎臓病の特集コーナー「慢性腎臓病とSDM」を開設しました！

Amazonギフトカード3000円分贈呈「糖尿病看護のあるある体験談」募集中！

早見表（インスリン製剤・血糖記録アプリ）最新版を販売中！

最新ニュース記事

SDMについてをまとめたコンテンツ『現代医療の必須ワード SDMって何？』を公開

【米国糖尿病学会】月1回注射の肥満症治療薬を開発 第2相試験は有望な結果に

【米国糖尿病学会】GLP-1受容体作動薬が末梢動脈疾患(PAD)を改善し歩行能力を向上

【米国糖尿病学会】GLP-1受容体作動薬による筋肉減少を防ぐ 高齢者の筋肉量を維持

【米国糖尿病学会】スタチンなどの脂質低下薬の使用が不十分 何万件もの心筋梗塞・脳卒中を回避

「学び直す糖尿病・内分泌の薬理学」のご紹介【糖尿病・内分泌プラクティスWeb】

糖尿病の眼疾患の合併リスクは血糖管理が不十分の高齢患者では3倍に上昇

体温低下がインスリン抵抗性と糖尿病に似た代謝異常を引き起こす 生理学研究所など

よく読まれている記事

関連情報・資料

論考百選 -エキスパートたちの視点-

学会レポート

慢性腎臓病とSDM～life goalsと療法選択～

糖尿病治療に役立つ情報をお届けするDexcom Express

肥満症認知向上プログラム【セミナーレポート】

医療スタッフのギモンにこたえる グリコアルブミンQ&A

糖尿病ネットワーク

国際糖尿病支援基金

SDMについてをまとめたコンテンツ『現代医療の必須ワード　SDMって何？』を公開

【米国糖尿病学会】月1回注射の肥満症治療薬を開発　第2相試験は有望な結果に

【米国糖尿病学会】GLP-1受容体作動薬による筋肉減少を防ぐ　高齢者の筋肉量を維持

【米国糖尿病学会】スタチンなどの脂質低下薬の使用が不十分　何万件もの心筋梗塞・脳卒中を回避

体温低下がインスリン抵抗性と糖尿病に似た代謝異常を引き起こす　生理学研究所など

論考百選　-エキスパートたちの視点-

医療スタッフのギモンにこたえるグリコアルブミンQ&A