回答患者问题的质量和同理心 ChatGPT vs临床医生谁胜出？-环球医学

关于环球医学

010-84476011

环球医学>> 临床用药>> 其他科室>>正文内容

其他科室

回答患者问题的质量和同理心 ChatGPT vs临床医生谁胜出？

来源：环球医学编译时间：2023年09月01日点击数: 5星

互联网医疗的快速扩张导致患者医疗咨询激增，并伴随着医疗专业人员工作量的增加，还可能带来倦怠。

人工智能（AI）助手有望帮助减轻临床医生不断增加的医疗信息负担，但是目前一些公共工具尚不能识别最基本的健康问题，能力堪忧。那么，最近大火的ChatGPT能胜任吗？2023年6月，发表在《JAMA Intern Med》的一项横断面研究，给出答案。

医生的医疗信息负担加重 AI助手有望解决

新冠疫情加速了互联网医疗的使用，在此期间，电子化患者信息增加了1.6倍，每条信息在电子健康记录中增加了医生2.3分钟的工作时间，以及更多的业余工作。额外的信息量预测会增加临床医生的倦怠感，62%的医生报告了至少1种倦怠症状，创历史新高。更多的信息也可能会导致患者的信息更有可能得不到回复，或得到毫无帮助的回复。

一些患者信息是主动提出的寻求医疗建议的问题，与一般信息（如安排预约、获取检测结果）相比，回答这些问题也需要更多的技巧和时间。目前减少这些信息负担的方法包括限制通知、对回复进行收费或将回复委托给培训不足的支持人员。不幸的是，这些策略可能会限制获得高质量医疗保健的机会。例如，当患者被告知他们的提问信息可能会被收费时，患者发送的信息会更少，与临床医生的来回交流也将更短。

AI助手是一种未经探索的解决信息负担的资源。虽然一些专有的AI助手显示出了潜力，但一些公共工具甚至未能识别基本的健康概念。

大型自然语言处理模型ChatGPT的面世，是AI领域最重磅的进展之一。2022年11月30日，ChatGPT一经发布就吸引了大量用户，并因其在广泛的主题上编写接近人类质量的文本的能力而广受认可。该系统不是为提供医疗保健而开发的，其帮助解决患者问题的能力尚未得到探索。

回答患者问题的质量和同理心 ChatGPT均胜过临床医生

发表在《JAMA Intern Med》的该项研究，评估了ChatGPT对患者问题提供高质量回答和同理心的能力。

在该研究中，使用来自公共社交媒体论坛中公共且非指定的问题数据库，从2022年10月开始随机抽取195个医疗问题，每一个问题都有人类医生作出回答。通过在2022年12月22日和23日将原始问题输入新的会话（之前没有在会话中提出任何问题），生成聊天机器人的回答。

原始问题以及匿名和随机排序的医生和聊天机器人回答，由一组有执照的医疗保健专业人员进行3次评估。

评估人员选择“哪一个回答更好”，并判断“提供的信息质量”（非常差、差、可接受、良好或非常好）和“提供的同理心和态度”（不具同理心、轻度同理心、中度同理心、同理心和非常同理心）。平均结果按1～5分进行排序，并在聊天机器人和医生之间进行比较。

在195个问题和回答中，在585个评估中，对于78.6%（95%CI，75.0%～81.8%）的评估，评估者更喜欢聊天机器人的回答而非医生回答。平均（IQR）医生回复显著短于聊天机器人回复（52[17～62]个字vs 211[168～245]个字；t=25.4；P<0.001）。聊天机器人回复的质量显著高于医生回复（t=13.3；P<0.001）。例如，被评为良好或非常好质量（≥4）的回复比例，聊天机器人高于医生（聊天机器人：78.5%，95%CI，72.3%～84.1%；医生：22.1%，95%CI，16.4%～28.2%；）。这相当于聊天机器人良好或非常好质量回复的发生率高出3.6倍。

聊天机器人的回答也被评为比医生的回答显著更具同理心（t=18.9；P<0.001）。聊天机器人被评为同理心或非常同理心（≥4）的回答比例高于医生（聊天机器人：45.1%，95%CI，38.5%～51.8%；医生：4.6%，95%CI，2.1%～7.7%）。这相当于聊天机器人同理心或非常同理心回答的发生率高出9.8倍。

在这项横断面研究中，聊天机器人对在线论坛中提出的患者问题作出了高质量和富有同理心的回答。在临床环境中有必要进一步探索这项技术，例如使用聊天机器人起草回复，然后医生再进一步编辑。随机研究可以进一步评估使用AI助手是否可以改善回答，降低临床医生的倦怠感，并改善患者的预后。

改善工作流程和患者预后 AI辅助有潜力

研究人员不知道聊天机器人在临床环境中如何回答患者的问题，尽管之前被忽视，但目前的研究激励人们研究采用AI助手进行信息传递。例如，经过测试，聊天机器人可以根据患者的咨询起草一条回复信息，供医生或支持人员编辑，从而在与患者交流信息时为临床医生提供帮助。这种方法适合当前的信息应对策略。当前的信息应对策略为，临床医生团队通常依赖于预设回复或由支持人员起草回复。这种AI辅助的方法可以释放生产力，使临床人员可以将节省的时间用于更复杂的任务，从而产生更一致的回答，并通过审查和修改AI书面草稿帮助工作人员改善整体沟通技能。

除了改善工作流程外，对人工智能辅助信息的投资也可能影响患者的结局。如果更多患者的问题得到快速、富有同理心和高标准的回答，可能会减少不必要的临床就诊，为真正需要的患者腾出宝贵的医疗资源。此外，信息传递是促进患者公平的关键资源，行动不便、工作时间不规律的个人可能会转向信息传递。高质量的回答也可能改善患者的预后。对于一些患者来说，积极回应的信息可能会间接影响健康行为，包括药物依从性、饮食依从性等。

在随机临床研究的背景下评估人工智能辅助技术对其实施至关重要，包括研究临床人员的结果，如医生倦怠、工作满意度和敬业度。

（选题审校：何娜编辑：常路）
（本文由北京大学第三医院药剂科翟所迪教授及其团队选题并审校，环球医学资讯编辑完成。）

（专家点评：本研究从一个公开平台寻找已经被回答的医疗相关问题，可以反映该场景下的真实情况，但尚不能反映付费、有医疗责任场景下ChatGPT与诊疗实践的对比结果。）

参考资料：
JAMA Intern Med. 2023 Jun 1;183(6):589-596.
Comparing Physician and Artificial Intelligence Chatbot Responses to Patient Questions Posted to a Public Social Media Forum
https://pubmed.ncbi.nlm.nih.gov/37115527/