小米推出首个推理开源大模型Mimo！以7B参数打败OpenAI o1-mini和阿里QwQ-32B-Preview

AI生存日记

于 2025-05-01 05:20:34 发布

阅读量331

点赞数 6

文章标签：开源 API Open AI大模型开发语言人工智能 gpt

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2501_91868913/article/details/147642947

版权

4月30日，小米推出专注推理能力的开源大模型MiMo，仅用7B参数规模在数学推理和代码竞赛测评中超越OpenAI的闭源模型o1-mini以及阿里32B规模的QwQ。

据小米介绍，Xiaomi MiMo诞生之初探索的核心问题就是激发模型推理潜能，这款模型联动预训练到后训练，全面提升推理能力。

国内外AI竞争日趋白热化，本周阿里前脚发布Qwen 3，马斯克后脚就官宣Grok 3.5。而据此前媒体报道，小米正在建设万卡GPU集群，并引入顶尖AI人才，显示出对大模型领域的全面投入。

性能突破：小参数量实现大能力

Xiaomi MiMo这款模型最引人注目之处在于，在数学推理（AIME 24-25）和代码竞赛（LiveCodeBench v5）公开测评集上，MiMo 仅用 7B 的参数规模，超越了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。

技术之外：小米的AI全面投入战略

据界面新闻报道，小米正在搭建自己的GPU万卡级集群，将对AI大模型进行大力投入。一名知情人士透露，该计划已经实施数月之久，小米创始人雷军亲自参与领导。该人士强调："在AI硬件这件事情上，最核心的是手机而不是眼镜，小米在这个领域不'all in'是不可能的。"

小米的AI人才布局也在加速。12月20日，第一财经报道称DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉将加入小米，或供职于小米AI实验室，领导小米大模型团队。罗福莉是MLA（Multi-head Latent Attention）技术的核心开发者之一，该技术在降低大模型使用成本上发挥了关键作用。

受此消息提振，截至午间休市，小米集团今日股价上涨4.74%，总市值1.29万亿港元（约合人民币1.21万亿元）

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。