斯坦福研究人员开发AI模型以增强癌症预后预测

更新时间:2025-01-10 06:06:32
源新闻来源:News Medical
语言:英语,所在国:美国
分类:AI与医疗健康

将视觉信息(如显微镜和X光图像、CT和MRI扫描)与文本信息(如检查记录、不同专科医生之间的沟通)相结合,是癌症护理的关键组成部分。尽管人工智能可以帮助医生审查图像并识别异常细胞等疾病相关异常,但开发能够整合多种类型数据的计算机模型一直是一个难题。

现在,斯坦福大学医学院的研究人员开发了一种能够整合视觉和基于语言的信息的AI模型。经过训练,该模型在预测数千名患有不同类型癌症患者的预后方面表现出色,能够识别哪些肺癌或胃食管癌患者可能受益于免疫疗法,并确定哪些黑色素瘤患者最有可能复发。

研究人员将这个模型命名为MUSK,即具有统一掩码建模的多模态变压器。MUSK与当前临床环境中使用的人工智能方式有显著差异,研究人员认为它有望改变人工智能如何引导患者护理。

“MUSK可以准确预测许多不同种类和阶段癌症患者的预后。我们设计MUSK是因为在临床实践中,医生从不依赖单一类型的数据来做出临床决策。我们希望利用多种类型的数据获得更多的见解,并对患者结果进行更精确的预测。”放射肿瘤学副教授李瑞江博士说。他是斯坦福癌症研究所的成员,也是这项研究的资深作者。该研究于1月8日发表在《自然》杂志上,博士后学者项锦曦和王希悦是该研究的主要作者。

虽然人工智能工具在临床上的应用越来越多,但它们主要用于诊断(例如,这张显微镜图像或扫描是否显示癌症迹象?),而不是用于预后(例如,这个人可能的临床结果是什么?哪种治疗方法最有效?)。其中一部分挑战在于需要大量标注数据(例如,这是一张含有癌症肿瘤的肺组织切片的显微镜图像)和配对数据(例如,这是关于肿瘤来源患者的临床记录)。然而,精心策划和注释的数据集很难获得。

人工智能的角度来看,MUSK被称为基础模型。基础模型在大量数据上进行了预训练,可以通过额外的训练定制执行特定任务。由于研究人员设计了MUSK可以使用不符合传统人工智能训练要求的未配对多模态数据,因此计算机在初始训练期间可以使用的“学习”数据池扩大了几个数量级。有了这一起点,任何后续训练都可以通过更小、更专业化的数据集完成。实际上,MUSK是一个现成的工具,医生可以根据具体临床问题进行微调。

“最大的未满足临床需求是医生可以用来指导患者治疗的模型。这位患者需要这种药物吗?还是我们应该专注于另一种类型的治疗?目前,医生使用诸如疾病分期和特定基因或蛋白质等信息来做这些决定,但这并不总是准确的。”李博士说。

研究人员收集了来自国家数据库——癌症基因组图谱——的16种主要类型癌症(包括乳腺癌、肺癌、结直肠癌、胰腺癌、肾癌、膀胱癌、头颈癌)患者的组织切片显微镜图像、相关的病理报告和随访数据(包括患者的治疗效果)。他们使用这些信息训练MUSK预测特定疾病的生存率,即在特定时间段内未因某种疾病死亡的人口比例。

对于所有癌症类型,MUSK准确预测了患者特定疾病生存率的75%。相比之下,基于癌症分期和其他临床风险因素的标准预测方法正确率为64%。

在另一个例子中,研究人员训练MUSK使用数千条信息预测哪些肺癌或胃食管癌患者最有可能受益于免疫疗法。

“目前,决定是否给患者某种免疫疗法的主要依据是该患者的肿瘤是否表达一种叫做PD-L1的蛋白质。这是一种由单个蛋白质组成的生物标志物。相比之下,如果我们能使用人工智能评估数百或数千条多种类型的数据,包括组织成像以及从临床记录中收集的患者人口统计学、病史、既往治疗和实验室测试,我们可以更准确地确定谁可能会受益。”李博士说。

对于非小细胞肺癌,MUSK正确识别出约77%的受益于免疫治疗的患者。相比之下,基于PD-L1表达的标准免疫治疗反应预测方法正确率仅为61%。

当研究人员训练MUSK识别哪些黑色素瘤患者最有可能在初次治疗后的五年内复发时,也获得了类似的结果。在这种情况下,模型正确率约为83%,比其他基础模型生成的预测高约12%。

“MUSK的独特之处在于能够在预训练中结合未配对的多模态数据,这大大增加了与其他模型所需的配对数据相比的数据规模。”李博士说。“我们观察到,在所有临床预测任务中,整合多种类型数据的模型始终优于仅基于图像或文本数据的模型。利用这些未配对的多模态数据与像MUSK这样的人工智能模型将大大提升人工智能帮助医生改善患者护理的能力。”


(全文结束)

声明:本文仅代表作者观点,不代表本站立场,全文内容涉及AI跨语种自动翻译。如有侵权请联系我们删除。