谷歌发布史上最强开源大模型Gemma，性能超Llama-2，笔记本也能跑

turingbooks

于 2024-02-23 11:35:54 发布

阅读量421

点赞数

文章标签： llama

原文链接：https://mp.weixin.qq.com/s?__biz=MjM5Njc0MjIwMA==&mid=2649810850&idx=1&sn=eae5737bc770ad9b2ee2a6bd18e1abe7&chksm=bf8a04de1d2190703255724ffec1894e82abc498fa721075254d8aac235edcfe3b51dc2d98b0&scene=126&sessionid=0

版权

这两天 AI 界真是超级热闹，前有 Open AI 扔出 Sora 炸弹，如今 Google 在没有任何预告的情况下开源了全新大模型 Gemma。

此次发布的 Gemma 相比自家的 Gemini 更加轻量级，模型权重也一并开源。不仅可以在笔记本电脑上运行，而且还免费可商用，支持中文。看来很多创业公司已经开始两眼发光了。

还不知道 Gemma 是啥的，可以跟着我们来了解一下。

Gemma 是一个轻量级、最先进的开源大模型，采用与创建 Gemini 模型相同的研究和技术构建。Gemma 由 Google DeepMind 和 Google 的其他团队开发，灵感来自双子座，拉丁语 gemma，意思是“宝石”。除了模型权重外，谷歌还发布了一些工具，以支持开发人员创新、促进协作并指导负责任地使用 Gemma 模型。

目前 Gemma 在全球范围内可用。以下是有关 Gemma 的一些要点：

两种尺寸的模型权重：Gemma 2B 和 Gemma 7B。每种尺寸都带有预训练和指令微调的版本。
一个生成式人工智能工具包，为使用 Gemma 创建更安全的 AI 应用程序提供了指导和必要工具。
通过原生 Keras 3.0 为所有主要框架（JAX、PyTorch 和 TensorFlow）提供推理和监督微调（SFT）的工具链。
准备好现成可用的 Colab 和 Kaggle 笔记本电脑，以及与 Hugging Face、MaxText、NVIDIA NeMo 和 TensorRT-LLM 等流行工具的集成，使 Gemma 入门变得容易。
经过预训练和指令调整的 Gemma 模型可以在笔记本电脑、工作站或 Google Cloud 上运行，并可以轻松部署到 Vertex AI 和 Google Kubernetes Engine （GKE）上。
跨多个人工智能硬件平台进行优化确保行业领先的性能，包括 NVIDIA GPU 和 Google Cloud TPU。
使用条款允许负责任的商业使用和传播。

Gemini 是目前市场上最大、功能最强的人工智能模型，而 Gemma 与 Gemini 之间是共享技术和基础设施组件的。这也使得 Gemma 2B 和 7B 能够在其规模上比其他开放模型的性能更佳。

Gemma 更加轻量级，可以直接在开发人员笔记本电脑或台式计算机上运行。值得注意的是，Gemma 在 18 个关键基准测试中，已经明显超越了当前的主流模型 Llama-2 以及 Mistral。

特别是在数学、科学和编码相关的任务中， Gemma 表现突出。

看来前段时间被 Sora 抢走的热点，这次谷歌势必要抢回来了。

就连 Google 人工智能研究员、Keras 作者 François Chollet 都说：“最强开源大模型的位置现在易主了。”

不少用户已经开始安装使用了。

发布当天短短几个小时，在 Hugging Face 上，Gemma 的 2B 和 7B 模型已经双双登顶。

全民 AI 时代真的要来了吗？

面对如此卷的 AI 界，作为普通人还是要扎实基础，不断更新技能，为未来做好准备！

大模型底层知识储备

《Python深度学习（第2版）》

[美] 弗朗索瓦·肖莱 | 著作
张亮 | 译

本书由深度学习框架 Keras 之父弗朗索瓦·肖莱执笔，通过直观的解释和丰富的示例帮助你构建深度学习知识体系。作者避免使用数学符号，转而采用 Python 代码来解释深度学习的核心思想，包括 Transformer 架构的原理和示例。

《深度学习入门：基于Python的理论与实现》

斋藤康毅 | 著

陆宇杰 | 译

本书是深度学习真正意义上的入门书，深入浅出地剖析了深度学习的原理和相关技术。书中使用 Python3，尽量不依赖外部库或工具，从基本的数学知识出发，带领读者从零创建一个经典的深度学习网络，使读者在此过程中逐步理解深度学习。

《BERT基础教程》

苏达哈尔桑·拉维昌迪兰｜著

周参｜译

详细讲解十余种 BERT 变体的原理，本书聚焦谷歌公司开发的 BERT 自然语言处理模型，由浅入深地介绍了 BERT 的工作原理、BERT 的各种变体及其应用，书中用简单的文字清晰阐释 BERT 背后的复杂原理，让你轻松上手 NLP 领域的里程碑式模型。

其他大模型类图书

新书上市

《大模型应用开发极简入门：基于GPT-4和ChatGPT》

[比] 奥利维耶·卡埃朗，[法] 玛丽–艾丽斯·布莱特｜著

何文斯｜译

本书为大模型应用开发极简入门手册，为初学者提供了一份清晰、全面的“最小可用知识”，带领大家快速了解 GPT-4 和 ChatGPT 的工作原理及优势，并在此基础上使用流行的 Python 编程语言构建大模型应用。通过本书，你不仅可以学会如何构建文本生成、问答和内容摘要等初阶大模型应用，还能了解到提示工程、模型微调、插件、LangChain 等高阶实践技术。书中提供了简单易学的示例，帮你理解并应用在自己的项目中。此外，书后还提供了一份术语表，方便你随时参考。

《这就是ChatGPT》

[美] 斯蒂芬·沃尔弗拉姆｜著

WOLFRAM传媒汉化小组｜译

OpenAI CEO，ChatGPT 之父山姆·阿尔特曼推荐，国内首部由世界顶级 AI 学者、科学和技术领域重要的革新者、“第一个真正实用的人工智能”搜索引擎 WolframAlpha 发明人斯蒂芬·沃尔弗拉姆对 ChatGPT 最本质的原理的解释的权威之作！

《ChatGPT高效提问：prompt技巧大揭秘》

李世明，代旋，张涛 | 著

本书以通俗易懂的语言，详细介绍了如何编写高质量的提示，引导 ChatGPT 输出优质答案，满足各种信息需求。书中包含详细解释和丰富示例，旨在帮助读者掌握利用 ChatGPT 解决各种问题的实用技能。

全书内容分为 6 章，其中前 3 章为基础介绍，后 3 章为具体用法和实战。其中包含 13 个 prompt 常见用法，8 个 prompt 高阶用法，13 个应用场景，提供丰富的实践案例，另外还有 100 个优秀的 prompt 示例可供参考。

《利用ChatGPT进行数据分析》

张俊红｜著

10 万册畅销书作者，根据 ChatGPT 在数据分析各个阶段的应用情况，按照数据分析师的职业发展路径展开，带你快速上手高效运用 ChatGPT 进行数据分析。

《ChatGPT：人类新纪元》

马占凯 | 著

“搜狗输入法之父”、美团光年 AGI 布道师马占凯新作。本书用生动浅显的语言，用鲜活的故事，讲述 ChatGPT 前世今生、AI 发展史，获得罗永浩、梁宁、戴雨森、王建硕、王玥等大咖倾情推荐。附赠中国 AGI 全景图、ChatGPT 全景图拉页，让你对 ChatGPT 及 AGI 相关产业的发展一目了然。