Google发布了带有100万上下文窗口的Gemini 1.5_谷歌gimini context window-CSDN博客

本文链接：https://blog.csdn.net/wjjc1017/article/details/136268159

Google的AI团队一直在与OpenAI的开创性语言模型GPT-4保持同步。我一直在尝试最近推出的Gemini，并升级到每月20美元的高级版Gemini，到目前为止，体验非常糟糕。

今天，Google发布了一个重磅消息——Gemini 1.5，这是他们旗舰语言模型的一个极大改进版本。

Gemini 1.5带来了一些重大改进，旨在解决初始版本的不足之处：

100万标记上下文窗口： 这是目前任何大规模基础模型中最大的上下文窗口。OpenAI的GPT-4只有128K的上下文窗口。
更快的响应： Google采用了可能为GPT-4提供动力的专家混合（MoE）架构。这使得模型能够将提示分解为子任务并将其路由到专门的“专家”，极大地提高了效率和性能。
快速信息检索： 新模型展示了在大量文本、视频或音频数据中准确定位特定细节的能力的显著提升。
更擅长编码： 大上下文窗口使得对整个代码库进行深入分析成为可能，帮助Gemini模型理解代码的复杂关系、模式和理解。

最令人震惊的是上下文窗口大小的升级。虽然大多数当前的大型语言模型（LLM）最多只能处理约128,000个标记，但Gemini 1.5 Pro的实验版本可以处理惊人的100万个标记。

Gemini 1.5 100万标记上下文窗口

Google

这个容量可以处理：

这是一个绝对的游戏改变者——想象一下将整个特色电影剧本、数千行复杂代码或一本大部头的书籍输入到语言模型中。它提供了足够的上下文来分析微妙的互动、追踪角色发展或在大规模上找到代码错误。

Gemini 1.5 100万标记上下文窗口

Google

可以将其视为要求聊天机器人分析30秒对话与剖析《指环王》三部曲中角色动机之间的差异。

作为开发者，最令人印象深刻的功能可能是能够上传整个代码库并要求Gemini在几分钟内构建整个模块。这有多酷？

Gemini 1.5 能够上传整个代码库并要求Gemini在几分钟内构建整个模块

Google

除了带来最新的模型创新，Google还让您更容易使用Gemini进行开发。

简单调整： 您可以在Google AI Studio内的几分钟内为您的特定需求定制Gemini的一组示例。
新的开发者界面： 使用Gemini API与新的Firebase扩展一起在项目IDX的开发工作区中构建新的AI功能，或使用我们最新发布的Google AI Dart SDK。
更便宜的Gemini 1.0 Pro： 今天的稳定版本的价格比之前宣布的文本输入便宜50％，输出便宜25％。AI Studio的按需付费计划即将推出。