国内首个全场景深度思考模型 Baichuan-M1-preview
1 月 24 日,百川智能发布了国内首个全场景深度思考模型 Baichuan-M1-preview!
相比其他推理模型,Baichuan-M1-preview 同时具备语言推理、视觉推理、搜索推理三个维度的全面推理能力,各项能力在多个领域的主流开源、闭源评测集上表现出众。
在语言推理方面,Baichuan-M1-preview 在 AIME、Math 等数学基准测试以及LiveCodeBench代码任务上的表现均优于 o1-preview 等模型,展现了其强大的语言理解和处理能力。
在视觉推理能力上,Baichuan-M1-preview 在 MMMU-val、MathVista 等权威评测中的成绩也超越了 GPT-4o、Claude3.5 Sonnet、QVQ-72B-Preview 等模型,进一步证明了其跨领域的卓越性能。
目前 Baichuan-M1-preview 已在百小应App中正式上线。
行业首个开源医疗增强大模型 Baichuan-M1-14B
百川智能还推出了行业首个开源的医疗增强大模型 Baichuan-M1-14B,作为 Baichuan-M1-preview 的小尺寸版本,Baichuan-M1-14B 在保持高性能的同时,更加灵活易用。
Baichuan-M1-14B 在通用能力和医疗领域表现出色,尤其在医疗场景中表现优异。
在 cmexam、clinicalbench_hos、clinicalbench_hos、erke 等权威医学知识和临床能力评测上,Baichuan-M1-14B 的成绩超越了更大参数量的 Qwen2.5-72B-Instruct,与 o1-mini 也相差无几。
通过 20 万亿token的高质量数据训练,Baichuan-M1-14B 在多个医疗科室实现了细粒度建模,并引入创新模型结构,提升了上下文理解和长序列任务表现。
Baichuan-M1-14B 开源链接:
-
Github: https://github.com/baichuan-inc/Baichuan-M1-14B
-
Huggingface(base): https://huggingface.co/baichuan-inc/Baichuan-M1-14B-Base
-
Huggingface(Instruct): https://huggingface.co/baichuan-inc/Baichuan-M1-14B-Instruct
-
NPU版本支持BF16推理:https://modelers.cn/models/MindIE/Baichuan-M1-14B-Base
参考:
https://mp.weixin.qq.com/s/hv8dYkKCimEadH9xFnGMtA
欢迎各位关注我的微信公众号:HsuDan,我将分享更多自己的学习心得、避坑总结、面试经验、AI最新技术资讯。