12月6日谷歌宣布推出全新大语言模型Gemini 1.0-CSDN博客

本文链接：https://blog.csdn.net/2301_77411198/article/details/135159261

Gemini（双子座）由Google Research和DeepMind等多个Alphabet团队共同打造。作为一款新型的强大多模态人工智能模型，它可以归纳、理解、操作以及组合不同类型的信息。不仅能够处理文本，图像、视频和音频，还可以完成复杂的数学、物理等科学领域任务，并能理解和生成各种编程语言的高质量代码。
Pichai将Gemini 形容为“我们迄今为止规模最大、能力最强的AI模型”，这是一个原生多模态的AI模型，也可以理解为多合一的全功能AI产品。它的诞生几乎耗尽了谷歌内部全部的计算资源。数代不同的专属GPU，已经全部压上去了，可谓是背水一战。看来AI的竞争大家已经杀红了眼。
Gemini是基于谷歌自家的TPUs v4和V5e算力，进行了大规模的训练，只为和微软的openai一争高下。

这次的发布会Gemini 1.0透露了三个不同功能和尺寸版本：
Gemini Nano — 端侧设备上最高效的模型。专为智能手机设计，可以在没有连接外部服务器的情况下执行高效的 AI 处理任务。现已集成入Pixel 8 Pro，可以支持录音应用中的“总结文本”功能，Gboard “智能回复”功能。从 WhatsApp 开始，明年还将扩展到更多应用。

Gemini Pro — 运行在谷歌数据中心，适用于各种任务的最佳模型。从今天起为最新版本的AI聊天机器人 Bard 提供支持。它能够快速响应并理解复杂查询，是 Bard推出以来的最大升级。目前为170 多个国家和地区提供英语服务，计划未来几个月内支持新的语言和地区，并应用于搜索、广告、Chrome 和 Duet AI等更多谷歌产品。

Gemini Ultra —规模最大且功能最强大的模型，专用于高度复杂的任务，会在完成当前测试阶段后的明年初向开发者和企业客户提供。届时还会推出基于Gemini Ultra的Bard Advanced更新版本。
在性能比拼上， 32 项基准测试中，Gemini 有 30 项领先于 GPT-4，其中包括多任务语言理解基准测试等广泛的整体测试，也有生成 Python 代码能力的测试。不过这一结论还有待进一步的证实。
不过中国的小伙伴们可能要失落一阵子，Gemini 没有正式推出中文服务。相信很快会推出，可以持续保持关注。

Gemini 1.0 的问世将打破ChatGPT一家独大的局面，让用户们可以根据需求有更多选择。市场的良性竞争也有助于AI大模型领域整体的创新发展。

期待谷歌此役取得成功