利用大语言模型为个体化肿瘤学提供决策支持任重道远-环球医学

关于环球医学

010-84476011

环球医学>> 临床用药>> 肿瘤>>正文内容

肿瘤

利用大语言模型为个体化肿瘤学提供决策支持任重道远

来源：环球医学编写时间：2023年12月11日点击数: 5星

精准医学通过考虑个体变异性来描述个体化临床决策的概念。2023年11月，德国学者发表在《JAMA Netw Open》的一项研究，利用大语言模型（LLM）为个体化肿瘤学提供决策支持。

重要性：精准肿瘤学复杂生物标志物的临床解释目前需要对既往研究和数据库进行手动调查。会话性LLM作为辅助临床决策制订的自动化工具可能是获益的。

目的：旨在使用4种最近的LLM作为精准肿瘤学的支持工具，评估其表现并确定其作用。

设计、地点和参与者：该诊断研究检测了10例虚构的具有遗传学改变的晚期癌症患者。2023年，每个病例都被提交给4个不同的LLM（ChatGPT、Galactica、Perplexity和BioMedLM）和1名专家医生，识别出个体化治疗选择。对治疗选择设盲，并提交给分子肿瘤委员会（MTB），其成员根据0~10分的量表（0分，极不可能；10分，极有可能）对来自LLM的治疗选择的可能性进行评分，并决定该治疗选择是否在临床上有用。

主要结局和测量指标：治疗选择的数量、准确性、召回率、LLM vs人类专家的F1评分、可识别性和建议的有用性。

结果：对于10名虚构的癌症患者（4例癌症，6例其他；每名患者的中位分子改变（IQR）为3.5（3.0~4.8）），人类专家和4个LLM识别出的治疗选择分别为中位（IQR）4.0（4.0~4.0）和3.0（3.0~5.0）、7.5（4.3~9.8）、11.5（7.8~13.0）和13.0（11.3~21.5）。当考虑将专家作为标准时，LLM提出的治疗选择在所有患者组合中的F1评分分别为0.04、0.17、0.14和0.19。将不同LLM的治疗选择组合在一起，精确度为0.29，F1评分为0.29，召回率为0.29。LLM生成的治疗选择被认为是AI生成的，中位评分（IQR）为7.5（5.3~9.0）分，而人类专家给出的选择为2.0（1.0~3.0）分。识别出AI生成的治疗选择的一个关键原因是没有足够的相关证据。对于每名患者，至少1个LLM生成了被MTB成员认为有帮助的治疗选择。其中2个独特有用的治疗选择（包括1个独特的治疗策略）仅被LLM识别出。

结论和意义：在这项诊断研究中，LLM在精准肿瘤学中的治疗选择没有达到人类专家的质量和可信度；然而，它们生成了有帮助的想法，可能是对既定选择的补充。考虑到技术的进步，LLM在协助筛查和选择相关生物医学文献以支持循证个体化治疗决策方面发挥越来越重要的作用。

（选题审校：何娜编辑：丁好奇）
（本文由北京大学第三医院药剂科翟所迪教授及其团队选题并审校，环球医学资讯编辑完成。）

参考资料：
JAMA Netw Open. 2023 Nov 1;6(11):e2343689
Leveraging Large Language Models for Decision Support in Personalized Oncology
https://pubmed.ncbi.nlm.nih.gov/37976064/