家医健康
国内健康世界健康探索科学

谷歌推出的新AI系统在疾病管理和药物推理方面表现更佳

新闻时间:2025年3月7日 - 更新时间:2025-03-09 00:06:46
来源:MarkTechPost
语言:英语,所在国:美国
分类:科技与健康 , 关键词:AI与医疗健康

将大型语言模型(LLMs)应用于临床疾病管理存在诸多关键挑战。尽管这些模型在诊断推理方面已经非常有效,但其在长期疾病管理、药物处方和多次就诊患者护理中的应用仍有待测试。主要挑战包括对多次就诊中上下文理解的局限性、对临床指南的异质性遵守以及药物推理的复杂性。此外,提供实时、高质量的患者互动和计算效率也是一个重大挑战。克服这些挑战对于开发能够辅助医疗专业人员提供准确、基于证据且个性化的疾病管理的AI系统至关重要。

早期的人工智能临床模型主要集中在诊断推理上,使用结构化数据集生成鉴别诊断。然而,当这些方法应用于实际疾病管理环境时,会遇到显著的限制。大多数现有方法无法在多次就诊中充分跟踪患者的病史,导致护理建议不连贯且不一致。各种模型还显示出无法有效遵守现有临床指南的问题,从而降低了其管理计划的可靠性。此外,药物推理是一个挑战,因为现有技术往往在药物选择、剂量和相互作用方面产生不一致性,从而降低了安全处方行为的可靠性。更重要的是,在医疗环境中需要实时决策,这涉及快速处理大量临床数据,这对大多数基于大型语言模型的系统来说是一个计算瓶颈。

谷歌研究人员展示了一种创新的基于LLM的代理系统,设计用于临床疾病管理和多次就诊患者互动。该解决方案通过一系列创新改进了基于AI的医学推理。提出了一个多代理系统,其中对话代理能够进行自然、富有同情心的对话,并从一次就诊到另一次就诊跟踪患者病史;管理推理(Mx)代理则根据临床指南、患者病史和测试结果创建结构化的治疗计划。该系统利用Gemini的扩展上下文功能来保持与当前临床指南和药物目录的一致性。与在静态单次就诊环境中运行的传统AI模型相比,该解决方案动态管理实时多次就诊互动,使建议能够根据患者进展和测试结果进行调整。还提出了一种新的多选基准RxQA,以评估药物推理的准确性。该数据集由两个国家药物目录(美国、英国)创建,挑战了处理复杂药理查询的能力,并显示在处理高难度药物相关任务方面优于人类临床医生的表现。

该系统结合了多种前沿方法以提高性能。实施了一项盲法随机虚拟客观结构化临床考试(OSCE),将这种AI增强的方法与21名初级保健医生在100个多次就诊病例场景中进行了比较,包括英国NICE指南和BMJ最佳实践指南。为了评估药物推理,RxQA基准由600道多项选择题组成,来自OpenFDA和英国国家处方集(BNF),并由认证药师验证。架构上,该系统包括一个基于Gemini 1.5 Flash的对话代理,优化了多次就诊的医学对话,以及一个基于结构化检索和推理的Mx代理,以生成详细的管理计划。结构化生成框架具有指定的约束条件,确保输出的一致性和临床指南引用的准确性。为了在实时患者互动中确保效率,该模型设计为在一分钟内响应,基于包含627个临床指南的综合评估语料库,其中包括1050万个标记,这需要优化检索方法来有效处理如此庞大的数据。

AI系统在疾病管理推理方面表现出与初级保健医生相当的性能,但在治疗准确性、药物推理和指南合规性等关键领域超越了他们。在多次就诊OSCE研究中,它提供了更结构化和准确的管理计划,提高了对临床指南的遵从性,并在治疗和检查建议方面更具针对性。药物推理能力也优于人类临床医生,特别是在高难度药物相关查询中,成功利用外部药物目录提高了准确性。此外,专科医生和患者演员的评分也反映了该AI系统在多次就诊中监测和更新管理计划的能力,确保了结构化和以患者为中心的决策。这些发现表明其有潜力改进基于AI的临床决策支持,提供准确、基于证据和有效的疾病管理解决方案。

这个AI系统在疾病管理方面取得了显著的进步,从简单的诊断功能发展到全面的患者护理和系统性的治疗规划。通过增加深度上下文推理、协调多个代理以及实时检索临床指南,它在复杂病例的决策能力上达到了与医生相当的水平。其准确治疗、增强药理推理和严格遵循既定协议的能力展示了其在AI辅助临床实践中的革命性潜力。虽然在实际环境中的应用还需要进一步的研究,但这项研究是在弥合初级保健差距、提高治疗一致性以及通过AI驱动的自动化最大化医疗服务方面迈出的重要一步。


(全文结束)