Gemini(双子座)由Google Research和DeepMind等多个Alphabet团队共同打造。作为一款新型的强大多模态人工智能模型,它可以归纳、理解、操作以及组合不同类型的信息。不仅能够处理文本,图像、视频和音频,还可以完成复杂的数学、物理等科学领域任务,并能理解和生成各种编程语言的高质量代码。
Pichai将Gemini 形容为“我们迄今为止规模最大、能力最强的AI模型”,这是一个原生多模态的AI模型,也可以理解为多合一的全功能AI产品。它的诞生几乎耗尽了谷歌内部全部的计算资源。数代不同的专属GPU,已经全部压上去了,可谓是背水一战。看来AI的竞争大家已经杀红了眼。
Gemini是基于谷歌自家的TPUs v4和V5e算力,进行了大规模的训练,只为和微软的openai一争高下。
这次的发布会Gemini 1.0透露了三个不同功能和尺寸版本:
Gemini Nano — 端侧设备上最高效的模型。专为智能手机设计,可以在没有连接外部服务器的情况下执行高效的 AI 处理任务。现已集成入Pixel 8 Pro,可以支持录音应用中的“总结文本”功能,Gboard “智能回复”功能。从 WhatsApp 开始,明年还将扩展到更多应用。
Gemini Pro — 运行在谷歌数据中心,适用于各种任务的最佳模型。从今天起为最新版本的AI聊天机器人 Bard 提供支持。它能够快速响应并理解复杂查询,是 Bard推出以来的最大升级。目前为170 多个国家和地区提供英语服务,计划未来几个月内支持新的语言和地区,并应用于搜索、广告、Chrome 和 Duet AI等更多谷歌产品。
Gemini Ultra —规模最大且功能最强大的模型,专用于高度复杂的任务,会在完成当前测试阶段后的明年初向开发者和企业客户提供。届时还会推出基于Gemini Ultra的Bard Advanced更新版本。
在性能比拼上, 32 项基准测试中,Gemini 有 30 项领先于 GPT-4,其中包括多任务语言理解基准测试等广泛的整体测试,也有生成 Python 代码能力的测试。不过这一结论还有待进一步的证实。
不过中国的小伙伴们可能要失落一阵子,Gemini 没有正式推出中文服务。相信很快会推出,可以持续保持关注。
Gemini 1.0 的问世将打破ChatGPT一家独大的局面,让用户们可以根据需求有更多选择。市场的良性竞争也有助于AI大模型领域整体的创新发展。
期待谷歌此役取得成功