美国AI芯片公司“赢”大模型？Samba-CoE v0.2超过多个业界知名对手

亲爱的数据

于 2024-04-02 12:02:19 发布

阅读量564

点赞数 3

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39640818/article/details/137310906

版权

美国AI芯片公司SambaNova发布了一万亿参数的开源模型Samba-1，并随后推出闭源MoE模型Samba-CoEv0.2，展示了其在AI领域的实力。SambaNova通过巧妙整合开源模型和专家组合，与巨头如华为、埃隆·马斯克的xAI公司竞争。

摘要由CSDN通过智能技术生成

原创：谭婧

2024年第一季度的尾巴，3月29日。

有一张发自厂商的喜报截图，

低调地在微信群之间转发。

或早或晚间，贾扬清在推特转发并点评此事。

细心的人很难不关注：

一家低调的AI芯片公司，

居然做了一个这么好的大语言模型。

那须得边挖边聊了。

喜报来自一家美国AI芯片初创公司：SambaNova。

从名字上看，Nova是新的恒星，

Samba就是“忘情桑巴舞”的那个桑巴。

那种淹没在鼓点和节奏里的舞蹈。

这让SambaNova这个名字听上去就能感受热情洋溢，干劲十足。

现在的AI世界，开源闭源一片欣欣向荣。

谁会是下一颗新星？

无论开源赢，还是闭源赢，都是AI芯片公司赢。

于是，AI芯片公司重金砸万亿参数模型，

一点毛病没有。

按着这个逻辑，回看中国，

同时拥有万亿参数大模型和AI芯片的公司，有哪几家？

这个问题很难回答，

因为万亿参数大模型就算在炼，也是高度保密的状态。

这个问题也不难回答，

玩家极其之少。

AI芯片的门槛很高，万亿参数的门槛也很高。

华为算是玩家之一，

但到底有没有炼出万亿参数大模型还是个未知数。

也许藏而不露，

也许还在奋斗。

不过，从过往信息来看，

华为公司倒是有一篇万亿参数大模型的论文很出名：

《PANGU（盘古）-Σ：基于稀疏异构计算的万亿参数语言模》。

研究归研究，发布归发布，

学术论文和正式推出万亿参数模型是两件事情。

SambaNova这家公司在2024年2月发布Samba-1（桑巴一号）。

开源模型，一万亿参数。

该模型与其 SN40L 芯片集成以提高性能。

SambaNova官网主页最显眼的地方写着：

Samba-1: One Trillion Parameters, One Model, One Platform

芯片公司这样说，翻译过来就一句话：

打法很明确，AI全家桶。

华为在AI战场上也是这个的打法。

看起来确实是竞争对手。

甚且，这家公司挺擅长乘胜追击。

有了Samba-1开源模型，他们并未止步。

成果就是于2024年3月29日，

推出的MoE闭源大模型，

Samba-CoE v0.2。

公司宣称：

“Samba-CoE v0.2模型运行速度惊人，

可达每秒 330 个标记词元（token），

超越了众多业界知名竞争对手的模型，

其中包括刚刚发布的Databricks DBRX、

MistralAI公司的 Mixtral-8x7B，

以及埃隆·马斯克旗下xAI公司的Grok-1 等。”

CoE就是Composition of Experts ，

目前流行的是MoE，Mixture of Experts。

看上去，CoE是MoE这种思路上的一种前进和创新。

对这种方法，还有一种粗暴的总结，

“开源模型的集成与模型合并”。

或者说，将多个小型“专家”模型聚合成一个大型解决方案，

充当单个大型模型。

既然“专家多”那么就可以横跨不同专业领域，

拥有更多更广泛的知识、且有更高精度，

以及让多模态锦上添花。

可以看到，官宣中提到的相比较的三个模型可都是开源模型。

拿闭源比较开源，有人发问了：

“为什么要将闭源模型与开源模型进行比较？”

推特上这位网友的疑问，其实反映了目前现状，

即闭源大模型和开源大模型之间竞争不可回避。

最低0.47元/天解锁文章

亲爱的数据

关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

亲爱的数据 CSDN认证博客专家 CSDN认证企业博客

码龄7年

185: 原创

24万+: 周排名

1万+: 总排名

13万+: 访问

: 等级

1732: 积分

323: 粉丝

371: 获赞

17: 评论

401: 收藏

私信

关注

热门文章

最新评论

云从科技从容大模型：大模型和AI平台什么关系？为什么造行业大模型？
CSDN-Ada助手: 一定要坚持创作更多高质量博客哦, 小小红包, 以资鼓励, 更多创作活动请看: 新星计划2023: https://marketing.csdn.net/p/1738cda78d47b2ebb920916aab7c3584?utm_source=csdn_ai_ada_redpacket 新星计划2023: https://marketing.csdn.net/p/1738cda78d47b2ebb920916aab7c3584?utm_source=csdn_ai_ada_redpacket 上传ChatGPT/计算机论文等资源，瓜分￥5000元现金: https://blog.csdn.net/VIP_Assistant/article/details/130196121?utm_source=csdn_ai_ada_redpacket 新人首创任务挑战赛: https://marketing.csdn.net/p/90a06697f3eae83aabea1e150f5be8a5?utm_source=csdn_ai_ada_redpacket Microsoft Edge功能测评！: https://activity.csdn.net/creatActivity?id=10403?utm_source=csdn_ai_ada_redpacket 职场解惑讨论会: https://activity.csdn.net/creatActivity?id=10427?utm_source=csdn_ai_ada_redpacket 可持续能源技术真的能改变世界吗？: https://activity.csdn.net/creatActivity?id=10425?utm_source=csdn_ai_ada_redpacket 无效数据，你会怎么处理？: https://activity.csdn.net/creatActivity?id=10423?utm_source=csdn_ai_ada_redpacket 物联网技术正在如何影响我们的生活: https://activity.csdn.net/creatActivity?id=10421?utm_source=csdn_ai_ada_redpacket 生物识别技术能否成为应对安全挑战的绝佳选择？: https://activity.csdn.net/creatActivity?id=10411?utm_source=csdn_ai_ada_redpacket 应届生如何提高职场竞争力: https://activity.csdn.net/creatActivity?id=10409?utm_source=csdn_ai_ada_redpacket 讯飞星火大模型将超越chatgpt？: https://activity.csdn.net/creatActivity?id=10407?utm_source=csdn_ai_ada_redpacket 职场新人备忘录: https://activity.csdn.net/creatActivity?id=10405?utm_source=csdn_ai_ada_redpacket “裸奔”时代下该如何保护网络隐私: https://activity.csdn.net/creatActivity?id=10401?utm_source=csdn_ai_ada_redpacket VR vs AR：哪种技术更有潜力改变未来？: https://activity.csdn.net/creatActivity?id=10399?utm_source=csdn_ai_ada_redpacket 蓝桥杯备赛指南分享: https://activity.csdn.net/creatActivity?id=10317?utm_source=csdn_ai_ada_redpacket
独家丨前美团联合创始人王慧文“正在收购”国产AI框架OneFlow，光年之外欲添新大将...
samRsa: 本文作者照片好漂漂
独家丨前美团联合创始人王慧文“正在收购”国产AI框架OneFlow，光年之外欲添新大将...
赵4老师: 本文作者照片好漂漂
清华系创企RealAI：独家“隐私保护机器学习”技术，全球首款编译级产品
普通网友: 收获很多，谢谢大佬的分享，要是能得到大佬的点赞必是极好的
清华系创企RealAI：独家“隐私保护机器学习”技术，全球首款编译级产品
普通网友: 学起来，头秃的那种~

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。