人工智能在诊断乳糜泻方面与病理学家水平相当

更新时间:2025-04-22 03:02:13
源新闻来源:Medscape
语言:英语,所在国:美国
分类:AI与医疗健康

要点:

经过十二指肠活检图像训练的机器学习模型在准确诊断乳糜泻(CD)方面达到了人类病理学家的水平,其敏感性和特异性均超过95%。

方法:

  • 发展中国家和发达国家都存在病理学家短缺的问题,这通常会导致患者诊断的长时间延迟。此外,研究发现,病理学家在通过十二指肠活检的组织学特征诊断乳糜泻时存在较高的差异性,而十二指肠活检是诊断乳糜泻的金标准。
  • 为了探讨人工智能AI)工具是否可以解决这一临床需求,研究人员使用了来自英国四家医院的3383张苏木精和伊红染色的十二指肠活检全切片图像及其临床诊断结果来训练一个机器学习分类器。
  • 使用来自第五家英国医院的644张先前未见过的活检扫描图像作为独立测试数据集,以评估模型的泛化能力。
  • 模型对测试数据集中30张图像的预测结果与四位胃肠病专科病理学家的诊断进行了比较。

结论:

  • 在训练集的交叉验证中,该模型的平均准确率、敏感性和特异性分别为96.8%、95.4%和97.2%。
  • 在测试数据集中的表现依然很高:准确率为97.5%,敏感性为95.5%,特异性为97.8%,受试者工作特征曲线下面积超过99%,表明该模型有可能超越人类病理学家的表现。
  • AI与病理学家之间的诊断一致性在统计上没有显著差异,突显了AI自动诊断乳糜泻的潜力。
  • 该模型在所有年龄大于19岁的男性和女性患者中表现同样出色,但在10至19岁年龄段的表现略低,可能是因为样本量较小。

实际应用:

“这代表了迈向临床实施用于诊断乳糜泻的机器学习辅助病理学的关键一步。这项研究表明,在真实、多中心、具有临床代表性的患者样本队列中,AI在乳糜泻诊断方面达到了人类水平的表现。这种泛化能力对于在现实世界临床环境中部署AI模型至关重要,因为在这些环境中,染色协议和扫描仪技术的差异会显著影响诊断准确性。”作者写道。

来源:

该研究的第一作者是英国剑桥大学病理学系的Florian Jaeckle博士和Lyzeum Ltd.公司,该研究在线发表在《NEJM AI》杂志上。

局限性:

主要的局限性在于用于训练和评估模型的诊断数据的准确性或“真实情况”,因为已知病理学家在乳糜泻诊断方面存在分歧。研究团队通过病理学家一致性实验来缓解这一局限性,但该子集仅包括30个病例,并且也没有提供完美的真实情况诊断。

披露:

资金由Coeliac UK和Innovate UK、英国国家卫生与护理研究所以及剑桥数据驱动发现中心提供。作者的披露信息可在ai.nejm.org上找到。


(全文结束)

声明:本文仅代表作者观点,不代表本站立场,全文内容涉及AI跨语种自动翻译。如有侵权请联系我们删除。