家医健康
国内健康世界健康探索科学

新AI模型在不侵犯隐私的情况下实现医疗机构间数据协调

新闻时间:2025年2月18日10时35分 - 更新时间:2025-02-18 18:56:39
来源:Devdiscourse
语言:英语,所在国:美国
分类:科技 , 关键词:AI与医疗健康

电子健康记录(EHRs)已成为临床和转化研究的基本资源,提供了大量患者数据用于大规模研究。然而,由于数据异质性和隐私问题,使用EHR数据进行多机构研究仍然面临挑战。最近,由周豆豆、佟涵、王林姗姗、刘苏琪等人发表在arXiv(2025)上的研究“表示学习以推进多机构电子健康记录数据研究”,介绍了一种名为GAME(Graph Alignment for Multi-institutional EHR Data)的新方法。该算法通过表示学习和联邦学习技术,在不共享患者级信息的情况下协调EHR数据,为多中心研究开辟了新的前景。

解决多机构EHR研究中的数据异质性问题

多机构EHR研究面临的最大障碍之一是各医疗机构之间医疗编码系统的不一致。不同的机构使用独特的本地代码来表示实验室测试、诊断和药物,这使得数据集成变得困难。GAME算法通过利用知识图谱、预训练语言模型和图注意力网络,将本地代码映射到标准化的医学术语(如ICD、LOINC和RxNorm),解决了这一挑战。

GAME在三个层次上进行整合:(1)在机构内部,它构建知识图谱,建立本地代码与标准代码之间的关系;(2)在机构之间,它利用语言模型识别不同编码系统之间的关系;(3)它应用图注意力网络(GATs)量化这些关系的强度。通过联邦学习联合训练嵌入式表示,GAME实现了跨机构的稳健代码转换,同时保护患者隐私。

通过联邦学习保护隐私

传统的多机构合作需要共享患者级别的EHR数据,这引发了重大的隐私和合规问题。联邦学习提供了解决方案,使各机构能够在本地数据上训练模型,只共享聚合参数而不是原始患者信息。GAME结合了联邦学习技术,创建联合训练的嵌入式表示,而不暴露个人患者记录。

研究人员在美国和法国的七家医疗机构测试了GAME算法,将其应用于心力衰竭、类风湿关节炎、阿尔茨海默病和自杀风险评估等多种条件下的患者分层,证明了其在维护数据安全的同时提高预测建模准确性方面的能力。

通过AI驱动的数据集成提升临床研究

除了协调EHR数据外,GAME还通过促进AI驱动的特征选择和预测分析,显著提高了多机构研究的质量。研究人员通过将其应用于阿尔茨海默病结局和心理健康障碍患者的自杀风险评估等临床研究,评估了该算法的性能。结果表明,经过GAME处理的EHR数据保留了宝贵的临床信息,实现了准确的AI驱动患者分层。

对于阿尔茨海默病,研究使用GAME嵌入式表示将患者按临床概况聚类,并预测养老院入住情况,这是疾病进展的关键指标。同样,在自杀风险评估中,GAME嵌入式表示允许识别高危患者亚组,展示了其在预测医疗应用中的潜力。这些发现表明,GAME可以通过更准确地识别患者亚组,增强精准医疗工作,适用于多样化的医疗环境。

多机构EHR研究的未来

GAME算法代表了多机构EHR研究的重大进展,提供了一种可扩展、保护隐私和可解释的数据协调方法。通过结合表示学习、知识图谱和联邦学习,它为跨机构整合、分析和解释异构EHR数据提供了强大的框架。

随着医疗数据复杂性的增加,像GAME这样的AI驱动解决方案将在打破数据孤岛和实现协作、大规模医学研究中发挥越来越重要的作用。未来的研究将集中于扩展GAME的应用范围至新的疾病领域,改进其AI模型,并整合更多的医学本体,以进一步改善数据标准化。

通过GAME,进行可扩展、注重隐私和高质量的多机构EHR研究成为现实,为更全面、数据驱动的医学研究和患者护理铺平了道路。


(全文结束)