ChatGPT高分通过中文执业医师执照考试未来给你看病的是AI？

发布时间：2023-07-25 16:02 分享到：

你能想象今后为你看病的，是一位人工智能机器人吗？

在科幻电影里并不少见的情景，似乎有越来越多成为现实的可能性了——上个月，浙江大学医学院附属第二医院神经外科吴承瀚团队在《数字医疗》期刊发表了一篇论文，他们用ChatGPT通过了中文执业医师执照考试。

继今年2月ChatGPT通过了美国执业医师考试之后，这位诞生不过半年多的生成式AI用中文通过了这场含金量很高的资格证书国考。

那么问题来了，在各个领域都大展身手的生成式AI，会取代医生吗？

“随便一考”就高分过关

先来看一看ChatGPT是怎么通过中文执业医师执照考试的。

执业医师执照考试分两部分，实践技能考试和笔试。

在实践技能考试环节，吴承瀚团队将10道病史采集题目发给ChatGPT，并请了两位医学生共同作答，最终将三位不署名的答案交给3位医生评审打分。

“这部分满分15分，ChatGPT拿到11分，不算高，但已经通过了。”吴承瀚说，团队发现ChatGPT能够详细覆盖所有临床问诊的内容，并抓住问诊重点。

接下来是笔试环节，团队用过去3年的中文执业医师资格考试测试ChatGPT，发现它能正确回答约72%的题目。这个分数高于80%以上的中国应试医学生。

对于这样的成绩，吴承瀚的看法是惊讶，令他惊讶的原因不在于人工智能通过了医师执照考试这件事，而是以英语为主要训练语言的ChatGPT，并不是针对任何考试而训练出来的专业模型，同样能通过中国考试。从最后的结果看，ChatGPT在知识类和逻辑类的题型上得分率接近，换句话说，当它被针对性训练后，得分会更高。

通过了中美两国的执业医师考试意味着什么？

“当时ChatGPT通过的是美国相当具有挑战性的三大专业考试，除了美国医学执业考试（USMLE），还有律师资格证考试和沃顿商学院MBA考试。”浙大二院脑科中心主任、浙江大学脑医学研究所所长张建民教授认为，“在ChatGPT高分值的背后，还有各种复杂因素。”

美国执业医师资格考试属于标准化考试，通常完成第一部分，医学生就要花去300至400小时的专业学习时间，更别说另外涉及临床诊断、医疗管理以及实习实践内容的两部分，“没有参加考前复习班、强化班，ChatGPT却轻松拿到52.4%至75%之间的得分率，比大部分学生考得还好，能力确实强大。”但看到成绩的同时，张建民强调，“不能完全撇开测试题处理方法等因素，比如ChatGPT的得分里，是去除了模糊不清的回答，更突出标准化的作答。”

张建民的这个观点与今年年初《科学公共图书馆·数字健康》上刊登的一篇文章不谋而合。这篇名为《ChatGPT通过美国执业医师资格考试让人们注意到医学教育的缺陷》的文章中提出，ChatGPT的成功一方面反映医师考试过于强调机械记忆，对疾病机理死记硬背，“不能充分评估现代医疗实践所需技能”；另一方面反映医学教学方式僵化，易让学生误以为医学上的问题“非对即错”。

临床上诊治疾病，医生一方面需要遵循诊疗规范，但另一方面还必须针对每个个体的具体情况，也就是个性化原则。因为每个病人的社会背景、家庭背景、传统习惯和经济条件及个人意愿等不同，面对同样的疾病，医生还需要考虑众多现实因素，才能做出带有个性化的人文关怀的治疗决策。有时病人对这些信息的流露只是透过一个细微表情，甚至只是交谈中叹了口气，“这些小动作都有可能会影响医生的治疗决策，但显然AI医生感知不了。”

“医生对一个疾病的判断，还需要从动态角度分析，看疾病的演变过程。”在张建民看来，目前人工智能给出的诊断，更多是依据基本条件，有章可循的规律性资料来判断这是什么诊断，该如何治疗。“它更像是三维范围内的学习记忆，而我们医生还常需把时间维度放入诊断中，这样看问题会更全面。”

尽管目前越来越多的研究表明，ChatGPT在医疗方面的合理概率越来越高，但它依然存在回答不合理的概率，这对严肃且关乎生命的医学领域可能就会造成不良的结果。

所以，在惊叹学霸ChatGPT惊人学习能力的同时，张建民认为，真正要让人工智能在医院得到全面运用，还有不少路要走。

医生会因此失业吗？

“人工智能没法取代医生，但一定能更好地帮助医生，特别是提高地方医疗水平。”吴承瀚给出的答案很笃定。

原因很简单，医疗环节中，需要“人”的参与作为闭环。

吴承瀚提到：“比如让经验丰富的科室主任参加执业医师考试，也未必能拿到满分，但他们在平时的医疗工作中，出错率可能不到万分之一。”在他看来，考试分数和医疗技术水平并不能画上等号，这中间的差距，是因为医疗团队中更多的“人”在起作用。

那么，轻松考过执业医师执照的人工智能，将怎么帮助医生和病人呢？

就在本周，上海交通大学医学院附属瑞金医院展示了“未来医院”建设的最新成果，包括大模型赋能的AI健康咨询、“云上瑞金”智慧服务、全流程管控的智慧运营平台，让人看到了“人工智能+医疗”更强大的功能，和未来看病的各种可能。

“三年前浙大二院与浙江大学脑机接口团队合作完成了国内第一例植入式脑机接口临床研究，最后就是利用步进为0.1毫米的手术机器人，将4毫米×4毫米大小的阵列电极成功植入张大伯大脑皮层神经元的第4-5层。”张建民说，“人工智能在医疗领域已经得到应用，包括我们现在经常看到的手术机器人。人工智能表现出的超人记忆力、算法和精准性，不断赋能医疗健康领域。”

“我们要利用的是，人工智能的智力，但无法解决多维度问题的存在，注定人工智能不会像人类这样拥有高智商。它并不是无所不能的。”张建民认为，“医疗领域只是AI出世后面对众多领域中的一项，但医疗有着特殊性，是与人面对面打交道的，所以人工智能更需要进一步关注它的安全性、有效性，以及伦理监管问题，需要相应的规范引导，出台制定法律法规和相应的监管措施。”

未来，虽然ChatGPT不一定会替代医生来对病人进行诊治，但未来的医疗，一定会是人机协同的医疗。

这点也得到了最早研究AI医生的公司之一谷歌的回应。7月12日，Google和DeepMind的科研人员在《自然》杂志上发表一项研究，表示大语言模型构建的AI医生在很多方面与人类医生相当，但这项技术不会威胁到全科医生的工作，未来可能更多用于医疗求助热线。

我们对人工智能医疗可以有怎样的期待？

你是不是有这样的经历？挂了专家号，排队1小时，最后和专家交流时间不到10分钟……“我们希望人工智能可以在与患者互动、收集病史方面起到作用。”吴承瀚说。今年4月，来自英国的研究团队利用ChatGPT为患者写临床报告，他们发现ChatGPT能在很短时间就给出相对准确的疾病科普和健康指导，而且与大多数临床医生写的报告相比，其文笔更富有同情心和耐心。

希望人工智能在患者与医生沟通中成为桥梁，这也是吴承瀚团队开始这项研究的一个原因。

在温州市瓯海区的泽雅镇中心卫生院里，你可以看到这样的情景——年轻的全科医生卢鹏飞戴着一支AR眼镜，而从扩音器里发出的，是另一位更老成的男声。

卢鹏飞在通过AR眼镜连线上级医院专家为病人看病。

“我们的上级医院专家，可以通过这样的AR设备，清楚看到病人的情况，及时做出诊断。”卢鹏飞说。

在这科技感满满的场景中，并没有“人工智能”在起作用，不过在卢鹏飞看来，人工智能的发展能让这样的专家远程会诊成为更普遍的事情。

“我们不缺病人，但有时对疑难病例的诊断、用药有欠缺，通过AR眼镜连线专家是一种方式，人工智能对疑难病例的判断以及用药建议也是一种方式。”

“在我们急诊的第一时间里，人工智能应该还起不到作用，不过在后续治疗中，它的作用可以很大。”松阳县人民医院急诊科医生雷国鑫告诉潮新闻记者，“作为基层医生，总要面对新的医疗情况，但缺少与专家交流、更新医疗知识的情况。比如有新的特效药出现时，它和哪些成分的药有冲突、配伍禁忌？解决这问题一方面是经验，一方面是指南，人工智能可以在这方面为我们提供帮助。”

虽然ChatGPT还没能起到药物索引的作用，但雷国鑫已将它作为刷题工具了。他表示：“为了通过中级职称考试，我们会下载相关的题库APP，买一个会员，但ChatGPT已经可以为我们出题，并给出答案了。”

基层医疗对人工智能的辅助作用翘首以盼，而在人类医疗高精尖的钻研上，人工智能也在发力中，特别是在医学影像识别、疾病诊断以及制药三个领域。

在医学影像识别方面，人工智能主要是帮助医生预先标注影像中可能存在病变的部分。这节省了大量的时间，与此同时，在一些难以察觉的病症上，人工智能精准和高效的优势显露无遗。

在美国，一家名为VideaHealth的牙科护理公司，其率先开拓了人工智能在牙科领域的应用。目前，美国90%的牙科诊所都可以使用这一平台辅助诊断。

此外，人工智能在疾病诊断方面也有着极为亮眼的表现。

在国际著名科学期刊《PLOSONE》上的一项研究指出，深度学习模型在阿尔茨海默氏症诊断中比未经训练的人工智能模型更加准确，而且该技术能够排除一些干扰诊断的因素，如年龄。

马萨诸塞州综合医院研究人员用数万张人脑扫描图像训练了一个深度学习模型，部分图像是患有阿尔兹海默氏症的患者大脑，部分没有，随后该研究将该模型与真实临床诊断数据进行了对比。

在制药方面，人工智能的作用集中在新药研发上。凭借强大的数据整合与分析能力，人工智能能够帮助科学家识别新药靶点、设计新药、预测药物疗效及毒性，从而缩短药物发现及开发的时间，节省成本。

(来源："网信浙江”）

(链接：https://mp.weixin.qq.com/s/ScMwGN9SOrUhO_keyhZkkg）

ChatGPT高分通过中文执业医师执照考试 未来给你看病的是AI？

ChatGPT高分通过中文执业医师执照考试未来给你看病的是AI？