新研究测试了谷歌开发的乳腺癌检测人工智能系统在英国医院乳腺 X 光检查中的实际运行情况。尽管该系统早在 2020 年就已推出,但尚未被常规用于患者诊断。
研究表明,在某些情况下,AI 能够比首位人类专家发现更多的肿瘤,同时减少假阳性结果的数量。
系统如何运作
谷歌系统利用了三套卷积神经网络,这些网络是在大规模的乳腺 X 光影像数据库上训练而成的。这些模型共同生成图像表征,识别可疑区域,随后评估癌症存在的概率。
该系统的研发与测试由伦敦帝国理工学院、萨里大学、皇家萨里 NHS 基金会信托以及其他国家医疗服务体系(NHS)筛查中心的科学家共同参与。
测试结果
在一项回顾性研究中,分析了 11.6 万名 50 至 70 岁女性的乳腺 X 光片,该系统达到了 0.541 的敏感度,而首位人类专家的敏感度为 0.437。这意味着 AI 捕捉到了更多真实的癌症病例。
同时,该系统保持了 0.943 的高特异性,仅略低于医生的 0.952,但在统计学上具有可比性。
一个重要的发现是,该系统能够识别出约 25% 最初被人类医生遗漏但随后在患者身上确诊的癌症病例。
在模拟 AI 替代双重阅片中第二位阅片者的场景中,该系统表现略优于人类,同时通过更高效地分类病例,可将专家的工作负担降低约 40%。
实地运行测试
在另一项研究中,分析了 2023 年和 2024 年间来自 12 家英国诊所的约 9,250 张新影像。AI 系统与常规诊断并行工作,但并未影响医生的决策。
在此测试中显示,AI 速度显著更快:评估一张影像平均耗时 17.7 分钟,而首位人类专家的评估则需超过两天。
即使在此测试中,该系统也保持了比首位医学评估更高的敏感度,以及相当的特异性。
优势与局限
结果证实,AI 可显著帮助缓解医疗系统的压力,特别是在放射科医生短缺且检查量巨大的地区。
然而,部分医生对系统输出表示不信任,这表明关键问题不仅在于技术准确性,还在于技术在临床实践中的接受度。
更广泛的背景
乳腺 X 光检查中应用人工智能延续了自 20 世纪 90 年代计算机辅助诊断系统出现以来的发展历程。真正的迅猛发展始于 2010 年代中期深度学习技术的兴起,当时模型开始超越传统方法。
乳腺癌每年影响全球约 230 万名女性,数十万病例导致死亡。因此,早期诊断至关重要。
deeplearning.ai/gnews.cz - GH
评论
登录 · 注册
请登录或注册后再评论。
…