新型AI工具可能在出生时预测自身免疫疾病风险

更新时间:2025-04-03 22:12:37
源新闻来源:Healio
语言:英语,所在国:美国
分类:AI与医疗健康

一种使用机器学习和患者遗传信息的风险预测评分工具,可以比现有模型更准确地识别自身免疫疾病,根据《自然通讯》杂志上发表的研究结果,其准确性最高可提高1000%。

“我们的DNA和基因在风湿性疾病中起着关键作用,并且在我们的一生中不会改变,除非在极端情况下,”宾夕法尼亚州立大学医学院公共卫生科学系研究副主席、人工智能和生物医学信息学主任以及生物信息学和基因组学研究生项目联合主席刘大江博士告诉Healio。“因此,它们为早期诊断和风险预测提供了很好的工具——例如,在出生时就可以预测红斑狼疮。”

“进行医疗和生活方式干预对于减轻疾病症状和改善生活质量至关重要,”他补充道。“通常情况下,风湿病的许多药物都是在不了解个体间反应差异的情况下给予患者的。基因也使我们能够探索不同个体之间的反应差异,并为风湿病医生提供个性化治疗的工具,实现精准医疗。”

刘大江及其同事使用电子健康记录和大规模的类风湿性关节炎和系统性红斑狼疮遗传研究数据创建了该工具,命名为遗传进展评分(GPS)。

该工具使用了一种称为迁移学习的机器学习技术,即在初始数据集上训练后,可以微调模型以执行相关任务或处理相关数据集。

与现有的风险预测工具相比,研究人员发现这种新的评分在确定哪些患者的症状会进展到更严重的疾病方面,准确性提高了25%到1000%。

Healio与刘大江讨论了人工智能与电子健康记录的结合、他们模型的惊人准确性以及这些发现对临床风湿病医生的意义。

Healio:为什么决定使用人工智能来追踪自身免疫疾病患者的电子健康记录?这项研究的理论基础是什么?

刘大江: 在宾夕法尼亚州立大学,我们有一个自身免疫疾病工作组,其中包括风湿病领域的领先专家Nancy Olsen博士、皮肤病领域的Galen Foulke博士、分子生物学领域的Laura Carrel博士以及我在人工智能/数据科学方面的专长。我们一直在思考如何最好地利用尖端技术来大幅改善风湿病护理。

风湿病往往无法治愈,必须依靠长期治疗来缓解症状。这些长期治疗有许多副作用。通过现代分子和数据科学技术及人工智能,我们可以在这方面取得很大改进。我们关注的一个领域是前临床自身免疫疾病,即患者只有一部分症状但不符合完整的诊断标准。只有部分前临床患者会进展到临床疾病状态。最好是在前临床阶段识别出有进展风险的患者,并尽早进行干预。

人工智能和基因在这里特别有用,因为我们可以找到表明进展风险的基因或其他分子标记模式,并应用靶向治疗方案。

Healio:结果显示,您的方法比现有方法的准确性提高了25%到1000%。为什么?您的方法有什么不同?

刘大江:人工智能中有一种称为迁移学习的技术。我们并没有发明它,但我们创新地将其用于自身免疫疾病进展的风险预测模型。例如,为了基于病理图像预测肿瘤是良性还是恶性,我们采用从区分猫和狗的模型并对其进行调整以分类肿瘤。我们不是从头开始重新发明轮子。与猫和狗的图像相比,病理图像的数量微不足道,因此调整经过大量数据训练的通用任务模型将有助于特定任务的数据有限的情况。

同样的方法也适用于我们的应用。

目前已有用于预测某人是否会发展成红斑狼疮的机器学习模型,但没有用于预测从前临床阶段进展的模型。想法是调整用于预测疾病发生率的模型以预测疾病进展。鉴于进展数据有限,我们可以利用迁移学习的思想,从用于预测疾病发生率的模型中获取信息,从而大幅提高预测准确性。

Healio:为什么家族史是一个如此重要的风险预测因素?

刘大江: 红斑狼疮具有很高的遗传性,这意味着基因在其中起着重要作用。我们从父亲那里得到一半的DNA,从母亲那里得到另一半,所以我们有50-50的机会继承他们的良好或不良基因。

除了遗传因素外,慢性疾病还严重依赖于环境。家庭成员往往有相似的饮食和生活方式,这也是家族史对风险预测至关重要的另一个原因。

值得注意的是,许多自身免疫疾病共享风险因素。如果某人的家族成员患有某种自身免疫疾病,那么患任何自身免疫疾病的风险都会显著增加。因此,在评估某人的风险时,考虑家族史——以及基因——非常重要。

Healio:您的工具还结合了哪些其他因素?血液检测结果、医生就诊等?

刘大江: 我们还可以进一步依靠血液检测结果,如细胞因子和抗体测量、处方信息和医疗程序来进一步改进模型。人工智能和大型语言模型在这方面非常有帮助。

Healio:这种方法有哪些担忧、缺点或局限性?

刘大江: 像所有研究一样,我们的研究也有局限性——不是方法本身的局限性,而是缺乏来自多样化人群的训练数据。

红斑狼疮存在一些祖先差异。例如,非裔美国人似乎有更严重的症状、更明显的性别偏见和更快的进展速度。不幸的是,关于红斑狼疮或其他疾病的遗传研究很少来自非裔美国人,样本量也小得多。要训练公平的人工智能模型,我们需要来自多样化人群的训练数据。

另一方面,基于人工智能的技术可以帮助招募农村地区的患者,这在这方面有所帮助。

Healio:您是否正在寻找随着人工智能技术进步改进此工具的方法?如果是,如何改进?

刘大江: 是的,有很多其他的改进方法。一个方向是扩展模型以整合来自其他模态的数据。

目前,我们专注于整合遗传数据。然而,还有许多可以方便测量并纳入模型的其他因素。例如,有许多细胞因子和抗体测试可以非常有助于风险预测。随着这些数据在大规模上的可用性增加,我们的方法可以扩展以包含它们。我们预计会有进一步的改进。

Healio:在哪些方面可以通过人工智能进一步改进?

刘大江: 另一个改进领域是大型语言模型(LLM)。目前,我们的诊断信息仅来自账单代码。借助LLM,我们现在可以更容易地解释电子健康记录中的非结构化图表数据,这将使我们能够更方便地从医生的笔记中检索信息。它将使我们能够更精确地了解疾病结果,这是自身免疫疾病研究中的一个挑战。


(全文结束)

声明:本文仅代表作者观点,不代表本站立场,全文内容涉及AI跨语种自动翻译。如有侵权请联系我们删除。