家医健康
国内健康世界健康探索科学

生成式AI在医疗保健领域的应用:解决医务人员绩效问题

新闻时间:2025年2月3日 - 更新时间:2025-02-25 20:13:07
来源:DataDrivenInvestor
语言:英语,所在国:美国
分类:科技 , 关键词:AI与医疗健康

从金融到政府,生成式AI解决方案每天都在各个行业中得到整合,医疗保健行业也不例外,越来越多地利用AI应对复杂挑战。本文将描述ELEKS的生成式AI解决方案,该方案用于从不同类型的临床文档中创建摘要。

医疗保健行业是世界上文件最密集的行业之一。每天都会生成大量的患者数据、临床报告、行政记录和实验室结果,这使得医生、护士和其他医疗专业人员需要管理的文档数量令人难以承受。一些文档可能长达数十页。

平均而言,一家医院每年生成50拍字节(petabytes)的数据。

——世界经济论坛

为了更好地理解这一点,1拍字节等于100万吉字节。这意味着单个医院每年产生的数据量相当于大约5000万台每台具有1太字节存储空间的智能手机。实际上,95%的数据未被使用,因为这些数据大多是未结构化和未分类的。

此外,手动审查医疗记录非常耗时,容易遗漏信息,尤其是在医疗提供者仅有15-20分钟进行患者咨询的情况下。

医疗数据手动审查的典型挑战:

  • 错过关键信息:在处理大量非结构化数据时,很容易忽略患者状况或病史中的一些重要信息。
  • 决策延迟:当医生需要处理大量记录进行分析和沟通时,这可能导致诊断或治疗的延误。
  • 减少与患者的交流时间:阅读和理解报告会占用直接护理患者的时间,可能影响医疗服务质量。

ELEKS团队开发了一种由生成式AI驱动的概念验证(PoC),以应对这些挑战。该解决方案不仅能够创建可定制的患者数据摘要,以满足不同医疗专业人员的需求,还包括一个文档分类功能,支持不同类型临床文档的处理。下面我们详细探讨这一解决方案。

生成式AI驱动的医疗文档摘要

我们的团队旨在开发一种生成式AI解决方案,可以生成特定格式的医疗文档摘要,适合医疗专业人员使用。对于这个概念验证,我们研究、比较并选择了最相关的开源大型语言模型(LLM),同时遵守医疗行业的法规。

我们设定了以下指导方针:

  • 概念验证将使用通用预定义提示,以生成简明的摘要。
  • 我们将专注于总结特定的医疗文档,包括护理评估、治疗笔记、医生笔记、护理计划(CMS表格485)、实验室测试、OASIS文档和出院总结。
  • 所有过程将遵守HIPAA和GDPR法规。

在我们的过程中,最大的挑战是获取文档样本,因为医疗数据具有敏感性。虽然我们可以在网上找到不同的文档模板,但获得真实样本非常困难。为此,我们使用ChatGPT生成了一些文档样本。

此外,在医疗领域操作需要严格遵守数据安全协议和法规,如HIPAA和GDPR。特别考虑到截至本文发布时,2024年已有435起数据泄露事件,因此数据安全和隐私至关重要。

流程概述:从文档接收至AI驱动的摘要生成

我们的医疗文档摘要解决方案自主运行,一旦新记录添加到数据库中即激活。流程从通过电子邮件接收医疗文档开始,触发初始处理阶段。

我们观察到医疗记录通常以图像文件或PDF形式存储。为了解决这个问题,我们实施了一个光学字符识别(OCR)模块,将这些文档从图像和不可识别的文本转换为可识别和可搜索的文本。

OCR完成后,文档内容将以离散字段的形式存储在数据库中,从而将非结构化数据转换为结构化内容。

根据遇到的不同类型的临床文档,我们在OCR之后加入了分类模块。为了分类文档,我们使用生成式AI,并使用与摘要生成相同的模型。为此,我们开发了一个单独的提示,描述每种文档类型以匹配相应的文档。

一旦记录经过OCR识别并分类,文档的摘要将自动生成。目前,我们的解决方案支持逐个文档生成摘要,每个新文档都会生成独立的摘要。

如果无法识别文档类型,摘要生成过程仍将继续,以避免文档未被总结。

模型选择和技术栈

在开发概念验证的过程中,我们调查了各种大语言模型(LLM),以确定生成医疗文档摘要的最佳解决方案。我们基于三个参数选择最佳模型:提示能力、价格和最终摘要的质量。

我们研究了通用模型如GPT-3.5 Turbo和GPT-4,以及专门为医疗摘要训练的大语言模型,包括DHEIVER/Medical Summarisation、MedLlama2、Meta-Llama/Meta-Llama-3.1–8B和FalconAI/Medical Summarisation。让我们更仔细地看看它们。

尽管这些模型产生了合理的结果,但缺乏灵活性。我们无法通过提示自定义输出;我们上传文档并等待预配置的摘要,而提示能力是我们的重要标准。总体而言,这些模型的结果并不差,但我们发现通用模型结合有效的提示显著提高了结果。

这一见解使我们选择了Llama 3.1,这是一种“自我托管”的大语言模型,为我们提供了更多的控制权和安全性,因为信息是“自我托管”的。然而,运行这种强大的模型需要大量的计算资源,维护具有足够性能的虚拟机成本高昂。为了解决这些问题,我们从“自我托管”转向Azure AI,这使我们能够在几分钟内切换模型,仅支付使用的费用,并立即获得输出。

我们还尝试了ChatGPT 3.5 Turbo,但它在分析文档大小方面有限制(最多几页)。意识到这一点后,我们决定切换到更新的模型,如GPT-4。

目前,我们依赖于Azure AI,运行OpenAI的GPT-4模型。该解决方案为我们提供了提示的灵活性和处理及总结大量医疗数据的能力。

在整体架构方面,我们的概念验证完全基于Microsoft Azure平台。我们在后端使用.NET技术来管理和调整工作流。Azure AI和.NET的组合在总结医疗信息方面有效、灵活且可扩展。

未来愿景:计划升级和创新

  1. 分离OCR和摘要模块

首先,我们设想将OCR模块与摘要模块分离,使摘要成为一个独立的服务。这将允许部署摘要模块,集成不同的信息源,特别是与EMR系统。这些变化可以节省阅读大量信息的时间,使专家能花更多时间在患者护理上。

  1. 集成EMR系统

如前所述,电子邮件是医疗文档的来源,但不适合处理大量数据,也不易安全保护。与外部系统如EMR或其他数据库集成,将使医疗提供者能够访问和处理广泛的患者记录。这些变化可以节省阅读大量信息的时间,使专家能花更多时间在患者护理上。作为此解决方案的一部分,我们将提取的文档数据转换为FHIR文档,以模拟与实际EMR集成的最后一步。

  1. 综合患者档案摘要

目前,该系统只能一次为一个文档创建摘要。下一步改进是分析和合成多个关于特定患者的文档,生成完整的摘要。该功能将使医疗专家能够在“一页纸”上获得所有必要的和关键信息,从而加强治疗效果和决策。

结论

在短短几周内,我们创建了基于AI的医疗文档摘要解决方案,这是应对医疗信息过载挑战的重要一步。通过利用先进的语言模型和云技术,该工具为医疗专业人员提供了快速消化大量患者数据的方法,有可能改善决策和患者护理。

可以看到,其他系统、格式和模型可以快速集成到这个概念验证中。展望未来,计划中的增强功能——包括EMR集成和多文档合成——将进一步简化医疗流程。这项创新展示了如何利用AI提高效率并改善患者结果,使医疗提供者能够专注于直接患者护理。随着医疗行业的发展,像这样的解决方案将在管理日益增长的医疗数据量方面发挥关键作用,最终有助于构建更高效和响应迅速的医疗系统。


(全文结束)