来源:大阪都立大学 作者:Hirotaka Takita 团队

近日,大阪都立大学发表标题文章“生成人工智能的诊断能力可与非专业医生相媲美”。
使用生成人工智能进行诊断已经引起了医学领域的关注,并就该主题发表了许多研究论文。然而,由于每项研究的评估标准都不同,因此需要进行全面的分析,以确定人工智能在实际医疗环境中可以使用的程度,以及它与医生相比具有哪些优势。
由博士领导的一个研究小组。大阪都立大学医学研究生院的Hirotaka Takita和副教授Daiju Ueda使用2018年6月至2024年6月期间发表的83篇研究论文对生成性人工智能的诊断能力进行了元分析,这些论文涵盖了广泛的医学专业。在分析的大型语言模型(LLM)中,ChatGPT是最常研究的。
比较评估显示,医学专家的诊断精度比生成AI高15.8%。生成人工智能的平均诊断准确率为52.1%,生成人工智能的最新模型有时显示的准确性与非专业医生相当。
“这项研究表明,生成人工智能的诊断能力与非专业医生相当。它可以用于医学教育,以支持非专业医生,并协助医疗资源有限的地区的诊断。”博士说。塔基塔。“需要进一步的研究,例如对更复杂的临床场景进行评估,使用实际医疗记录进行绩效评估,提高人工智能决策的透明度,以及对不同患者群体进行验证,来验证人工智能的能力。”
研究结果发表在npj Digital Medicine上。
本文旨在通过对医疗保健中生成人工智能模型的诊断能力进行细致的元分析,来弥合文献中现有的差距。我们的重点是对生成人工智能模型进行全面的诊断性能评估,并将其诊断性能与医生的诊断性能进行比较。通过综合各种研究的结果,我们努力对医学诊断中生成性人工智能模型的有效性、潜力和局限性提供细致入微的了解。该分析旨在作为未来该领域研究和实际应用的基础参考,最终为医疗保健中人工智能辅助诊断的进步做出贡献。
期刊:npj数字医学
标题:生成人工智能和医生之间诊断性能比较的系统回顾和元分析
DOI:10.1038/s41746-025-01543-z
作者:Hirotaka Takita、Daijiro Kabata、Shannon L Walston、Hiroyuki Tatekawa、Kenichi Saito、Yasushi Tsujimoto Yukio Miki、Daiju Ueda
发布时间:2025年3月22日
网址:https://www.nature.com/articles/s41746-025-01543-z
本文转载自大阪都立大学,本文观点不代表雅典娜AI助手YadiannaAI立场。