Google最强开源大模型Gemma亮相！笔记本就能跑__笔记

爱吃杂酱面

于 2024-02-23 13:42:17 发布

阅读量658

点赞数 5

文章标签：笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ziyu9966/article/details/136253405

版权

Google宣布开源Gemma，一个基于Gemini技术的大规模语言模型，提供2B和7B两种版本，性能超越竞品，适合GPU/TPU部署和CPU端应用。低配版2B版本便于CPU和移动设备使用，支持多种框架和环境。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

2月21日，Google宣布开源了一个新的模型系列Gemma。这个模型使用了与它最强的Gemini同源的技术，并且在一系列的标准测试上优于几款今天最热门的开源模型。

根据Google官方的介绍，Gemma是一个大型语言模型，而非像Gemini那样是多模态的。它基于与Gemini相同的技术构建，主打开源和轻量级，免费可用、模型权重开源、允许商用，同时笔记本可跑。

1.版本

Gemma有2B和7B两个版本。7B版本参数量约78亿，面向GPU和TPU上的高效部署和开发；2B版本参数量约25亿，用于CPU和端侧应用程序。

两个版本都有预训练和指令微调版，可在Kaggle、Colab Notebook、Google Cloud中访问，而且支持JAX、PyTorch和TensorFlow通过原生Keras 3.0进行推理和监督式微调（SFT），适应多种开发需求和环境。

2.性能

Gemma-7B模型在涵盖通用语言理解、推理、数学和编程的8项基准测试中，性能超过了广泛使用的Llama-2 7B和13B模型。它在数学/科学和编程相关任务上，通常也超过了Mistral 7B模型的性能。

3.架构与参数

它基于Transformer解码器架构。Gemma-2B有18层，d_model为2048，而Gemma-7B有28层，d_model为3072。这些模型还具有不同的前馈隐藏维度、头数和KV头数，以及词汇量。

相比于基础Transformer，Gemma进行了一些升级。

7B版本使用多头注意力机制，2B版本使用多查询注意力机制。

在每一层中使用旋转位置嵌入代替绝对位置嵌入；使用GeGLU激活函数替代标准ReLU非线性。同时对每一个子层的输入和输出都进行归一化。

Gemma 2B/7B分别使用了2T和6T token进行训练，主要来自网络文档、数学和代码，不过这些数据不是多模态的。

为了兼容，谷歌使用了Gemini的SentencePiece tokenizer子集，它可以分割数字，不删除额外的空格，并对未知token进行字节级编码。

4.其他

有意思的是，在Google晒出的成绩对比中，阿里千问背后的模型Qwen系列表现也很亮眼：

原文：

谷歌最强开源大模型亮相：Gemini技术下放，笔记本就能跑，可商用_澎湃号·湃客_澎湃新闻-The Paper

大动作不停，Google加入开源战局！低配版“Gemini ”Gemma来了！相当于OpenAI把GPT-3开源了|Google_新浪财经_新浪网 (sina.com.cn)

爱吃杂酱面

博客等级

码龄5年

7
原创

133
点赞

129
收藏

94
粉丝

关注

私信

热门文章

上一篇：: Meta为什么要开源AI基础软件__笔记

下一篇：: 美国发布2024版“关键和新兴技术清单”__笔记

最新评论

【笔记】英伟达提高CUDA的兼容难度
CSDN-Ada助手: 恭喜作者第8篇博客的发布！看到您关于英伟达提高CUDA兼容难度的笔记，不禁让人感叹您对技术的深入理解和对行业动态的关注。接下来，希望您可以继续保持创作的热情和努力，探索更多有趣的主题，或许可以尝试深入分析不同GPU厂商的技术发展趋势，或者是介绍一些实用的CUDA编程技巧，让更多读者受益。期待您的下一篇作品！愿您在技术之路上不断前行，不忘初心，砥砺前行。
Google最强开源大模型Gemma亮相！笔记本就能跑__笔记
爱吃杂酱面: 谢谢！
Google最强开源大模型Gemma亮相！笔记本就能跑__笔记
CSDN-Ada助手: 恭喜您第5篇博客的发布！Google最强开源大模型Gemma亮相，让笔记本也能跑起来，真是令人惊叹啊！希望您能继续保持创作的热情和努力，为我们带来更多有价值的内容。或许下一步可以深入探讨Gemma的应用场景，或者分享一些使用心得和技巧，让更多人受益。期待您的下一篇博客！
Meta为什么要开源AI基础软件__笔记
爱吃杂酱面: 谢谢！
Meta为什么要开源AI基础软件__笔记
CSDN-Ada助手: 恭喜你写了第四篇博客！看到你对开源软件基础设施的思考，让我受益匪浅。希望你能继续分享关于 Meta 和开源软件基础设施的见解，也可以考虑深入探讨开源软件的发展趋势或者实践经验。期待你的下一篇作品！加油！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

大家在看

最新文章

目录

展开全部

收起

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。