MLM之Gemini：Gemini Pro 1.5的简介、安装和使用方法、案例应用之详细攻略

一个处女座的程序猿

已于 2024-03-25 00:59:00 修改

阅读量2k

点赞数 15

分类专栏： AI/AGI 文章标签：人工智能 Gemini

于 2024-02-21 22:23:44 首次发布

本文链接：https://blog.csdn.net/qq_41185868/article/details/136221945

版权

AI/AGI 专栏收录该内容

341 篇文章

订阅专栏

谷歌发布了GeminiPro1.5，一款具备100万令牌上下文长度的AI模型，采用MoE架构，提升了性能，特别在处理长文本和多模态任务上表现出色。开发者和企业可通过AIStudio和VertexAI体验其预览版。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

MLM之Gemini：Gemini Pro 1.5的简介、安装和使用方法、案例应用之详细攻略

导读：2024年2月15日，Gemini Pro 1.5是谷歌最新推出的人工智能模型，拥有超过100万令牌的上下文长度，能够一次性理解整本书籍、完整电影和播客系列。Gemini Pro 1.5模型实现了显著增强的性能，在跨模态长文本理解方面取得了突破性进展。Gemini 1.5具有明显提升的性能。通过对Transformer和混合专家(MoE)架构的研究和工程创新，在许多层面上都比前版本进行性能升级。

>> Gemini 1.5采用MoE架构，相比于传统的单一Transformer模型，它通过选择性激活专家子网络来实现更高效的训练和预测。

>> Gemini 1.5 Pro可以处理长达100万个标记的输入上下文窗口，此前最长的也就是3.2万个标记。这使它可以处理更复杂的多模态任务。

>> Gemini 1.5通过一系列机器学习创新实现了远远超过1.0版本3.2万标记上下文窗口的上下文窗口能力。

>> 在综合多类测试中的87%项目上，Gemini 1.5 Pro的性能都优于1.0 Pro。与1.0 Ultra相比，性能差异不大。

>> 谷歌进行了大量的操守和安全测试，以负责任地推广Gemini 1.5 Pro。开发者可以申请测试此模型。

>> 谷歌将继续在模型架构、训练效率、安全测试等方面进行研究，不断推进Gemini系列模型的发展。

Gemini Pro 1.5的简介

1、Gemini Pro 1.5的特点：

Gemini Pro 1.5的安装和使用方法

Gemini Pro 1.5的案例应用

Gemini Pro 1.5的简介

谷歌在2024年2月14日宣布了其新一代多模态大模型Gemini 1.5 Pro。这一模型在多个方面相较于其前代Gemini 1.0 Ultra实现了显著提升，包括在数学、科学和推理方面提高了28.9%，多语言方面提高了22.3%，编码方面提高了8.9%，并且在视频理解和音频处理方面也取得了显著进步。

Gemini 1.5 Pro是基于谷歌在基础模型开发与基础设施的最新研究成果，采用了新的专家混合（MoE）架构，这使得模型的训练和服务效率得到了显著提升。它的一个主要特点是能够处理极长的上下文，最长可达1,000,000 token，这使得它在处理超长文档、大型代码库和完整电影等多模态内容方面表现出色。目前，少数开发者和企业客户已被邀请在AI Studio和Vertex AI平台上体验这一私人预览版。

谷歌首席科学家Jeff Dean表示，Gemini 1.5的上下文理解能力可以支持百万级token的多模态输入，使用户能够轻松地与数十万字的超长文档、拥有数百个文件的数十万行代码库、一部完整的电影等进行交互。此外，为了介绍这款划时代的模型，谷歌还发布了一份长达58页的技术报告，详细阐述了Gemini 1.5的技术细节和创新点。

综上所述，谷歌的Gemini 1.5 Pro作为其新一代的多模态大模型，不仅在性能上有了显著提升，而且在处理长上下文和多模态内容方面展现了强大的能力，这标志着人工智能领域的一个重要进步。

Gemini 1.5 实现了显著增强的性能。它代表了我们方法的一次重大变革，建立在几乎所有基础模型开发和基础设施方面的研究和工程创新之上。这包括使 Gemini 1.5 在训练和服务方面更加高效，采用了新的专家混合（MoE）架构。

我们发布用于早期测试的首个 Gemini 1.5 模型是 Gemini 1.5 Pro。它是一个中等规模的多模态模型，经过优化，可在广泛的任务范围内进行扩展，并且在与迄今为止最大的模型 1.0 Ultra 相似的水平上运行。它还引入了一项在长文本理解方面的突破性实验功能。

Gemini 1.5 Pro 具有标准的 128,000 个标记上下文窗口。但是，从今天开始，一小部分开发人员和企业客户可以通过 AI Studio 和 Vertex AI 在私人预览中尝试将上下文窗口扩展到 100 万个标记。

随着我们推出完整的 100 万个标记上下文窗口，我们正在积极进行优化，以提高延迟，减少计算要求并增强用户体验。我们很期待人们尝试这一突破性功能，并在下文中提供更多有关未来可用性的详细信息。

官网地址：Introducing Gemini 1.5, Google's next-generation AI model

1、Gemini Pro 1.5的特点：

>> 上下文长度超过100万令牌，远超其他竞争对手的聊天机器人上下文窗口。

>> 采用混合专家（MoE）方法进行训练，提高了训练效率和响应质量。

>> 集成于谷歌AI工作室，可快速处理并输出大量信息，如上传的PDF文件、代码库、视频和音频等。

>> 相较于Gemini Pro 1.0和Gemini Ultra 1.0，Gemini Pro 1.5在多个基准测试中表现出显著的改进，甚至超越了刚刚推出的付费版本Gemini Ultra。

Gemini Pro 1.5的安装和使用方法

地址：https://aistudio.google.com/app/

开发者和企业客户可以通过AI Studio和Vertex AI进行Gemini 1.5 Pro的有限预览测试。开发者可以在AI Studio签名测试Gemini 1.5 Pro。企业客户可以通过Vertex AI账号团队申请测试。Gemini 1.5 Pro默认提供1.28万个标记的上下文窗口。部分开发者和企业可以尝试高达100万个标记的实验性上下文窗口。