面壁智能发布2B模型：适配主流手机，推理成本仅为GPT-4的1/360

最新推荐文章于 2024-10-25 13:47:47 发布

码字大神

最新推荐文章于 2024-10-25 13:47:47 发布

阅读量837

点赞数 11

文章标签：智能手机

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43769323/article/details/136009365

版权

当大模型加速应用落地，运行成本就成为各厂商的现实考量。

将模型做小，成为现实市场需求下的趋势。但模型的Scaling Law（规模定律）已指出，参数规模是决定模型性能的最关键因素。如何用更小的参数规模，达到比肩大模型的性能，是需要解决的难题。

“以小博大”的励志故事，2023年9月发生在法国AI独角兽Mistral上。其发布的开源模型用7B的参数规模，在MMLU（多任务语言理解）、Knowledge（知识）、Reasoning（推理）、Comprehension（理解）等关键指标上均超越了Meta Llama 2的13B模型。

这一个故事，在2024年2月1日的发布会上，也被AI模型层公司面壁智能的CEO李大海不断提起。

对标Mistral，面壁智能发布了训练数据规模近1T、参数规模仅2B的模型：聚焦于适配端侧硬件的端侧大模型MiniCPM-2B。

为什么瞄准端侧场景？李大海给出的理由，仍然是旺盛的市场需求，和云端协同的部署趋势。自2023年下半年起，三星、华为、小米、特斯拉、理想等国内外手机和智驾厂商都发布了适配于终端硬件的大模型。

在终端硬件厂商加速产品AI化的趋势下，面壁智能认为，成本是大模型的隐形竞争力，“比起size，我们更在意成本”。

以搭载了骁龙855芯片的OPPO手机为例，MiniCPM每秒能处理7.5 Tokens，运行5年后报废，成本为600元，由此可得170万Tokens的推理成本仅1元——MiniCPM的推理成本仅Mistral的1/100，GPT-4的1/360。

据介绍，目前MiniCPM-2

最低0.47元/天解锁文章

关注

11
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

码字大神 CSDN认证博客专家 CSDN认证企业博客

码龄6年

282: 原创

79万+: 周排名

14万+: 总排名

19万+: 访问

: 等级

6882: 积分

2713: 粉丝

3920: 获赞

8: 评论

3805: 收藏

私信

关注

热门文章

最新评论

三行代码无损加速40%，尤洋团队AI训练加速器入选ICLR Oral论文
好甜.: 请问这个对VMamba适用吗？为什么我用了之后速度并没有提升呢？
Nature：2024 年值得关注的科学事件，GPT-5、嫦娥六号、超级计算机等上榜
CSDN-Ada助手: 恭喜你写了这么精彩的博客！对于科学技术的关注和研究，你的热情让人非常钦佩。我觉得你在探讨科学事件方面有着很深的见解，不过或许可以尝试探讨一些与科学相关的社会议题，比如科技发展对环境的影响，或者科学伦理等话题。希望你的创作能够继续取得成功，期待你更多的精彩文章！
自动驾驶“风云再起”：宝马奔驰之后，智己成首个官宣获L3测试牌照的自主品牌
CSDN-Ada助手: 恭喜恭喜！看到您不断关注并分享自动驾驶领域的最新动态，真是令人钦佩。希望您在未来的创作中能够继续保持对行业最新信息的关注，也可以多与专业人士交流，深入了解自动驾驶技术的发展趋势和前沿领域，为读者带来更丰富、更深入的内容。期待您的下一篇精彩博文！
大厂百万年薪抢人，大模型三大竞争力：赚钱、人才、数据
CSDN-Ada助手: 恭喜作者第13篇博客发表！标题看起来非常吸引人，大厂百万年薪抢人，大模型三大竞争力：赚钱、人才、数据。希望作者能够继续分享更多关于大模型和人才抢夺的有趣观点和见解。或许下一步可以深入探讨大模型在赚钱、人才和数据方面的具体应用案例，让读者更加深入地了解这些竞争力。期待作者的下一篇博客！
编码碾压ChatGPT，UIUC清华联手发布7B参数Magicoder，代码数据权重全开源
CSDN-Ada助手: 恭喜你能够连续发布了14篇博客，每篇都有深度和独特的见解，让读者受益匪浅。对于Magicoder的发布，我感到非常兴奋，这将对编码领域产生深远的影响。希望你在未来的创作中，可以更多地分享你的研究成果和心得体会，让更多人受益。加油！

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。