谷歌开源系模型第二代免费开放!27B媲美LLaMA3 70B,单H100或TPU主机可跑

西风 发自 凹非寺
量子位 | 公众号 QbitAI

谷歌开源模型Gemma 2开放了!

虽然前段时间Google I/O大会上,Gemma 2开源的消息就已经被放出,但谷歌还留了个小惊喜——

除27B模型外,还有一个更轻的9B版本。

DeepMind创始人哈萨比斯表示,27B参数规模下,Gemma 2提供了同类模型最强性能,甚至还能与其两倍大的模型竞争

884d61fd3359133e6b5eeaa5135f277b.png

目前Gemma 2已入驻大模型竞技场(LMSYS Chatbot Arena),Gemma 2 27B排名与Llama3 70B相当:

051e4c22c0fd02e671fd4535487d9259.png

而Gemma 2 9B的排名甚至比肩Qwen 2 72B:

3357fd6ac12afbb015394cb9c1856303.png

该结果也让网友纷纷表示难以置信。

46f3cc6f0f0159eba3a922efebbab079.png

此外,VentureBeat表示,两种Gemma 2版本还不够,谷歌很快还将发布2.6B参数模型。

能打两倍大的模型

Gemma是谷歌的开源模型系列,采用Gemini同款技术架构,主打开源、轻量级、免费可商用。

今年二月份,Gemma系列正式上线第一代,共有2B和7B两个版本,笔记本可跑,性能全面超越当时的开源标杆Llama 2。

和羊驼家族一样,基于Gemma也有了很多变种,如CodeGemma、RecurrentGemma、PaliGemma等。

对于第二代Gemma 2,谷歌表示相比于Gemma,性能更高、推理效率更高,单个NVIDIA H100或TPU主机上可跑

上下文长度方面,Gemma 2为8192 Tokens

性能方面,Gemma 2与Llama 3、Grok-1基准测试结果对比如下:

0c25913b6f3d46ea21d51b5f36374892.png

Gemma 2 9B得分全面超越Llama 3 8B,Gemma 2 27B模型表现接近Llama 3 70B,且超越Grok-1和Qwen 1.5 32B:

5c2a0d194367c624022c9bf9cd0a960b.png

与Mistral和Gemma 1的比较结果如下:

d94862a05541bf18c67643f6963fe767.png

除此外,Gemma 2安全性相比前代也有显著提升:

268c9d6e7ae1d5fe714d0208bab334e7.png

技术报告中也有Gemma 2的更多信息。

基于Transformer解码器架构,与Gemma 1不同之处在于,Gemma 2每隔一层交替使用局部滑动窗口注意力和全局注意力机制,引入了分组查询注意力(GQA)以提高推理速度,相比Gemma 1也使用了更深的网络结构。

Gemma 2关键模型参数如下:

5bbff60ef3d917bf96f7a3c4c5c55e6c.png

网友实测

目前,用户还可在Hugging Chat上与Gemma 27B聊天。

有网友上手测试了一番:

11703c6aefee91939c272f7442d0d2a7.png

不过似乎是出Bug了,让Gemma 27B讲个故事,它愣是没刹住车,回复巨长:

我们也上手体验了一下,可能是有什么Bug……

e4fda6b9721dc7e03135356d5156df01.gif

这边还有网友使用苹果的MLX框架也在本地部署上了:

af3fcb9965e59780be6ba4d7057ba855.gif

谷歌表示,从下个月开始,Google Cloud用户也可在Vertex AI上部署和管理Gemma 2。

One More Thing

谷歌刚刚官宣Gemma 2开放,国产大模型就来踢馆了。

智谱AI放出1个月前发布的开源模型GLM-4-9B的得分,和Gemma 2的对比是这样婶儿的:

637e4322ab4d698dbba0ac963a7595a7.jpeg

HuggingFace:https://huggingface.co/chat/models/google/gemma-2-27b-it

参考链接:
[1]https://x.com/GoogleDeepMind/status/1806373224889954449
[2]https://x.com/demishassabis/status/1806417177496473966
[3]https://venturebeat.com/ai/googles-gemma-2-series-launches-with-not-one-but-two-lightweight-model-options-a-9b-and-27b/
[4]https://chat.lmsys.org/?leaderboard
[5]https://x.com/lmsysorg/status/1806369224895647757

量子位年度AI主题策划正在征集中!

欢迎投稿专题 一千零一个AI应365行AI落地方案

或与我们分享你在寻找的AI产品,或发现的AI新动向

b49863b28bd825bbc02d089be7d59a60.png

点这里👇关注我,记得标星哦~

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值