生成式AI疗法的首次试验表明其可能有助于治疗抑郁症

更新时间：2025-04-02 14:01:40
源新闻来源：MIT Technology Review
语言：英语，所在国：美国
分类：AI与医疗健康

首次对使用生成式AI的治疗机器人的临床试验表明，它在帮助患有抑郁症、焦虑症或饮食障碍风险的参与者方面与人类治疗一样有效。尽管如此，这并不能为那些在监管灰色地带运营的数十家宣传此类技术的公司提供通行证。

由达特茅斯学院盖塞尔医学院的精神病学研究人员和心理学家团队开发了名为Therabot的工具，并于3月27日在《新英格兰医学杂志》旗下的期刊《NEJM AI》上发表了研究结果。许多科技公司已经开发了用于治疗的AI工具，承诺人们可以比与专业治疗师更频繁且便宜地与机器人交谈——并且这种方法是安全有效的。

许多心理学家和精神科医生也认同这种愿景，指出不到一半的精神疾病患者能够接受治疗，而那些接受治疗的人每周可能只有45分钟的时间。研究人员试图通过技术手段让更多人能够获得治疗，但他们面临两个问题。首先，一个说错话的治疗机器人可能会造成实际伤害。因此，许多研究人员构建了基于明确编程的机器人：软件从有限的批准响应库中提取答案（就像1960年代建立的模拟心理治疗计算机程序Eliza）。但这使得它们与用户的互动不够吸引人，人们很快就会失去兴趣。第二个问题是，良好的治疗关系的标志——共同的目标和协作——很难在软件中复制。

2019年，当像OpenAI的GPT这样的早期大型语言模型开始成形时，达特茅斯的研究人员认为生成式AI可能有助于克服这些障碍。他们着手构建一个训练有素的AI模型，以提供基于证据的响应。他们最初尝试从互联网论坛上的普通心理健康对话中构建模型，然后转向数千小时的真实心理治疗会话记录。

“我们得到了很多‘嗯哼’、‘继续说’以及‘你的问题源于你与母亲的关系’之类的回答，”达特茅斯大学生物医学数据科学和精神病学副教授、该研究的资深作者Nick Jacobson在接受采访时说。“这些都是心理治疗的陈词滥调，而不是我们真正想要的。”

对此不满意后，他们开始根据基于证据的做法组装自己的自定义数据集，这最终成为了模型的基础。相比之下，市场上的许多AI治疗机器人可能只是基于类似Meta的Llama等基础模型的轻微变体，主要是在互联网对话中训练的。这对饮食障碍等话题尤其是一个问题。

Jacobson说：“如果你说你想减肥，它们会很乐意支持你，即使你的体重已经很低。” 人类治疗师不会这样做。

为了测试这个机器人，研究人员进行了为期八周的临床试验，共有210名参与者，他们都表现出抑郁症状或广泛性焦虑症，或处于饮食障碍的高风险中。大约一半的参与者可以使用Therabot，而对照组则不能。参与者对AI的提示作出回应并主动发起对话，平均每天发送约10条消息。

患有抑郁症的参与者症状减轻了51%，这是研究中的最佳结果。焦虑症患者的症状减轻了31%，而饮食障碍高风险者对身体形象和体重的关注减少了19%。这些测量结果基于自我报告的调查，虽然这种方法并不完美，但仍然是研究人员拥有的最佳工具之一。

Jacobson表示，这些结果与随机对照试验中16小时人类治疗的效果相当，但Therabot试验在大约一半的时间内就达到了这一效果。“我从事数字治疗工作很长时间了，从未见过这种长时间持续的参与度，”他说。

西蒙弗雷泽大学健康伦理助理教授Jean-Christophe Bélisle-Pipon表示，这些结果令人印象深刻，但他指出，就像任何其他临床试验一样，这并不一定代表该治疗方法在现实世界中的表现。

“我们距离大规模临床部署的‘绿灯’还很远，”他在电子邮件中写道。

一个问题是更广泛部署所需的监督。在试验初期，Jacobson亲自监督所有来自参与者的消息（参与者同意此安排），以注意机器人的不当回应。如果治疗机器人需要这种监督，它们将无法覆盖更多的人群。

我问Jacobson，他认为这些结果是否验证了蓬勃发展的AI治疗网站行业。

“恰恰相反，”他说，他警告称，大多数公司似乎并没有根据认知行为疗法等循证实践来训练他们的模型，而且他们可能没有一支训练有素的研究人员团队来监控互动。“我对这个行业以及我们在没有充分评估的情况下快速推进的速度有很多担忧，”他补充道。

当AI网站声称自己在合法、临床环境中提供治疗时，Jacobson说，这意味着它们属于美国食品药品监督管理局的监管范围。到目前为止，FDA尚未对许多这类网站采取行动。如果采取行动，Jacobson说，“我的猜测是几乎没有任何一家——可能是没有任何一家——在这个领域运营的公司有能力获得声明许可”。

Bélisle-Pipon指出，如果这些类型的数字疗法未获批准并整合到医疗保健和保险系统中，将会严重限制它们的影响力。相反，那些本应从中受益的人可能会寻求与非治疗目的设计的AI进行情感联系和治疗（事实上，OpenAI的新研究表明，与其AI模型的互动确实会对情绪健康产生非常真实的影响）。

“很有可能许多人将继续依赖更实惠的非治疗聊天机器人——如ChatGPT或Character.AI——来满足日常需求，从生成食谱创意到管理他们的心理健康，”他写道。

(全文结束)

声明：本文仅代表作者观点，不代表本站立场，全文内容涉及AI跨语种自动翻译。如有侵权请联系我们删除。