2025一开年,DeepSeek迅速席卷全国医疗行业。
超过100家医院已经部署了DeepSeek,覆盖了患者服务、科研、诊疗、办公、管理等各个方面。
同时,AI医疗大模型开始井喷,今年以来,瑞金医院、复旦大学中山医院,讯飞医疗接连发布医疗大模型;而伴随着开源生态,京东健康宣布全面开源旗下“京医千询”大模型。
新一波的医疗大模型应用有什么不同?智药局盘点了近年来发布的AI医疗大模型,试图找到答案。
以下是AI医疗大模型的具体情况:
中国AI医疗大模型
01.新一轮AI医疗狂潮
2022年12月,ChatGPT这一划时代的产品出现,如同一声惊雷开启了AI行业的新生。
2023年上半年开始,ChatGPT引发了国内企业的AI医疗“百模大战”。互联网医疗公司率先响应,科研院所、医院方迅速跟进。
相较于通用大模型,训练一个医疗大模型的难度并不大。绝大多数医疗大模型基于通用大模型的基座进行训练,通过领域医学数据进行微调,从而强化模型在医疗领域的专业能力。
2023年发布的医疗大模型中,大多由LLaMA、ChatGLM-6B等基座微调或者预训练而来,有实力的互联网公司也开始输出大模型基座能力,例如腾讯混元大模型,华为盘古大模型等。
到了2024年,医疗大模型陷入了同质化竞争,商业化难题让AI医疗大模型沉寂了一年。也是这一年,医疗大模型开始有了差异化竞争,医院和企业开始发布针对特定领域的专科大模型,精细化地整理细分知识后,发布重症、罕见病、病理学等专科模型。
2025年,DeepSeek的震撼发布也让医疗健康迎来了新一波AI浪潮。由于DeepSeek的发布较短,但区别于此前的AI模型竞争,目前绝大多数公司选择接入、部署DeepSeek,正在探索新一轮的AI大模型应用。
02.未来医疗大模型战场
后DeepSeek时代
AI技术日新月异,必须要以发展的眼光看待大模型的发展。
ChatGPT爆发后,多家公司基于大模型基座+医疗数据发布行业大模型。而当前绝大多数企业只是接入、部署DeepSeek等较为初级的应用,未来有望深度结合。
以DeepSeek为代表的深度推理大模型基座,可能在逻辑推理和复杂问题解决上有优势,这对医疗领域的复杂诊断和多步骤推理有帮助。
DeepSeek可以结合临床指南、PubMed论文、医院私有病历库作为外部知识源,通过RAG(检索增强生成)进行深度推理。
同时,AI大模型有望解析报告、CT影像、病理报告、心电信号等多模态数据,实现多维度证据链交叉验证。
这一趋势已经开始显现,例如清华系AI公司水木分子于近日发布 DeepSeek 版 ChatDD-R1 基座模型,赋能生物医药企业的药物研发。
同样,DeepSeek的出现也促进了医疗大模型开源。例如百图生科、京东健康相继宣布开源,由闭源模型转向开源生态。
数据为王
DeepSeek生态开放降低了医疗大模型的部署、训练门槛,但大模型的迭代仍然需要大量高质量数据。
医疗大模型竞争中,掌握医疗数据的医院成为主要参与方。当前超百家医院接入DeepSeek,整合信息系统和院内数据有望进一步带来医院智能化。
一方面,三甲医院覆盖的科室全面,能够提供多模态数据,如影像、病理、基因等,这对多模态大模型的训练很有帮助。
此外,三甲医院的医生经验丰富,可以在模型开发中提供专业指导,确保模型的准确性和实用性。他们的反馈能优化模型,在诊断和治疗建议方面至关重要。三甲医院有较强的科研团队,能够与高校或企业合作,推动AI技术的转化应用。
由此来看,医院提供数据+场景,企业提供技术的大模型开发联盟正在成为主流。
03.商业化难题
关于AI医疗,二级市场反应最大。
稍微和AI沾点边的医疗个股股价都直线飙升,包括阿里健康、医渡科技、华大基因、卫宁健康等公司股价拉升超过50%。
然而,当前AI医疗大模型一直面临着商业化难题。前不久,贝瑞基因点出了当前二级市场的炒作情绪。公司回应称:AI技术尚未成为核心业务组成部分,也未产生直接收入。
这也是当前大模型的通病:**拿着锤子找钉子。**AI医疗舆论爆火,但缺少可商业化的产品落地。
在C端,医疗大模型主要提供医疗问诊、医学科普等功能,目前并未出现类似DeepSeek、豆包等知名应用,更不用说通用大模型也未实现商业化。
部分企业选择将AI和业务进行结合,为主营业务做增值,例如京东健康的“康康”,能够在用户咨询症状后立即匹配线上医生问诊以及医药送达服务。
更多企业把商业化聚焦于B端,即为医院、药企、药店、体检中心提供模型服务,从而减少对C端用户的依赖。
从市场反馈来看,AI大模型的实际商业回报未能满足企业预期。
某医疗器械赛道的人士向智药局表示:“尽管公司有大模型相关业务,但主要是和器械进行搭售,在硬件的基础上加价卖给临床和学校,且基本上都是一锤子买卖,难以形成可持续现金流。”
这也是当前的AI医疗大模型难题,一方面,企业由于害怕错过新的AI浪潮,纷纷宣布接入DeepSeek;但另一方面,还未看到医疗大模型收费的曙光,更多只是业务锦上添花的作用,实际投入上变成了“雷声大,雨点小”。
也就是说,医疗模型的竞争必定走向差异化,以及解决问题的能力。
有一个好模型,并不一定能转化为业务价值,在复杂医疗场景中,并不是比谁的参数多,在基准测试中拿到高分,而是解决实际问题。
此外,AI医疗健康赛道还有大模型和小模型的技术与监管的差别。
以当赛道较早的颇为成熟的AI+影像赛道为例,由于入院的高门槛性,当前通过药监管局审批的AI影像器械均是单病种、特定场景的小模型。
小模型需要针对特定的数据进行清洗和高精度标注,例如肺部、心血管、妇科等适应症都需要单独审批,单独拿证。
尤其对于高计算需求、高预测要求的药物研发领域,例如分子生成、FEP+预测等,仍然以精度更高的小模型为主。
针对严谨的医学场景,一些做法是将大模型“变小”,即为医疗大模型找到合适的场景,企业开始基于大模型发布AI医疗品牌以及应用,希望将大模型转化为商业价值。
或者在模型端就切入更加细分的赛道,学习更窄的医疗知识,例如呼吸科、心血管科、儿科等,找到更落地的场景。
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。