医疗版ChatGPT直播评测!治疗方案与真人医生96%一致

杨净 发自 凹非寺
量子位 | 公众号 QbitAI

国内首个医疗大模型,已经在“接诊”患者了。

0efcf5e459d414162b75e769377255e7.png

最近,一组AI医生医院真实站岗数据曝光:

  • 共接诊120多名患者,从问诊、检查到诊疗方案全流程覆盖;

  • 涉及心内科、消化内科、呼吸内科、内分泌科、肾脏内科、骨科、泌尿外科七大疾病科室,患者疾病类别多元,复杂程度不一;

  • 医学水平不输国内三甲医院主治医生,与真人医生诊疗方案一致性达到96%;

  • 来自北大人民医院、中日友好医院、阜外医院和友谊医院等国内顶尖医院的7位专家教授围观点赞。

这样公开化、规模化的AI医生评测,在国内是首次,放眼全球也是第一次见到

更想不到的是,背后的主角MedGPT——基于Transformer的1000亿参数大模型,才刚问世一个月。

目前在实际诊疗中,它已经具备多轮连续对话和多模态能力。而在未来规划中,MedGPT还会上线医疗版的Plugin Store,预计将搭载1000+医疗应用,极大丰富AI医生的诊疗工具,提升诊疗效率。

从上述这些数据与表现来看,96%的一致性,想不到。

这样的迭代速度,更想不到。

MedGPT直播首秀:接待百名患者

这场直播首秀其实是一场实打实的人机医学一致性评测。除了AI医生MedGPT外,还有10位来自四川大学华西医院的主治医师共同参与。

为了保证评测的权威性和科学性,一方面由国内顶尖医院的专家教授组成评审团,进行审核和多维度打分。

另一方面,整个流程也进行了特别的设计。简单来说,患者进屋问诊,但是是和有医师执业资格的“翻译员”对话。翻译员把患者主诉在电脑上分别传递给真人医生和AI医生,如此多轮往复,最终根据检查结果,给出诊断。

就像当初AlphaGo大战围棋,中间帮助Alpha执行“落子”动作的执棋手,就是这个“翻译员”的角色了。

aac63fea4e2e9428ff8255efbbe06413.png

这样一来AI医生与真人医生之间互不干涉,且条件基本一致,双方就能给出独立的判断。

1720c4d3f3c4e2b56e082bbc4fae9f1e.png

最终,经过一天的鏖战,真人医生综合得分为 7.5分,AI 医生综合得分为 7.2分,比分结果上一致性达到了96%。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值