谷歌刚刚更新！新版 Gemini 2.5 Pro：顶级推理 + 百万上下文还免费！

AI信息Gap

于 2025-06-06 05:40:54 发布

阅读量962

点赞数 7

文章标签：人工智能 chatgpt OpenAI github pdf

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_40774379/article/details/148462684

版权

谷歌的 Gemini 2.5 Pro 又更新了，就在几小时前！

Gemini 模型这更新速度没谁了，几乎是一个月一次。

上个版本，是 5 月 6 日发布的 I/O 版。

今天发布的新版 Gemini 2.5 Pro 代号 gemini-2.5-pro-preview-06-05，已正式在 AI Studio、Vertex AI、Gemini App 全面开放试用。

尽管新模型还是 Preview，但它很可能就是几周后正式发布的长期稳定版本（GA，General Availability）。

也就是说，这是谷歌接下来一段时间里押注最重的旗舰模型。

01｜版本信息小抄：上线时间、上下文、接入方式

版本代号：gemini-2.5-pro-preview-06-05
上线时间：2025 年 6 月 5 日
当前阶段：Public Preview，预计数周内升级为 GA 稳定版
上下文窗口：
- 输入上限：1,048,576 tokens（真 100 万）
- 输出上限：65,536 tokens（64 K）
接入方式：Google AI Studio、Vertex AI、Gemini App
新增特性：支持“thinking budget”（推理预算）—— 可以控制思考成本/响应时长

02｜这次真有提升？几个值得注意的性能指标

推理能力：更强了!

这版 Gemini 模型在三个极难的基准测试上表现非常强：

HLE（高难度智力综合测试）
AIDER（代码与推理基准测试）
GPQA（研究生难度的问答测试）

在这些近乎 "竞赛级推理" 的测试中，06-05 版 Gemini 2.5 Pro 跑赢了 o3、Claude Opus 4、Grok 3 以及 DeepSeek R1。

用谷歌官方的话说：重回巅峰（回归 SOTA 水平）。

SOTA，“State of the Art”的缩写，意思是“当前最强水平”。

编码能力：WebDevArena 继续第一！

WebDevArena 榜单 Elo 分数从上一个版本的 1408 提升到了 1443，继续占据榜首。
AIDER Polyglot 等多语言代码基准中也稳居第一。
特别适合构建 Web App、自动化 UI、写前端动效、动画播放器等。
支持长代码上下文输入（100 万 tokens），能一口气跑完一整个项目文件。

响应质量：格式更整洁，回答更像“人话”

Google 官方在文档里明确提到，他们修复了 03-25 版本在非编码任务上的“回退问题”。

同时，在响应风格和结构上做了优化，回答格式更规整；更有创意。

除此之外，06-05 版本引入了一个新功能：“thinking budget”（思考预算）。

它允许你在每次使用模型时设定一个“预算范围”，来控制模型在推理阶段的资源（token）消耗。

预算越高，模型的推理就越深入全面；预算低时，它则倾向于给出更快速但可能浅显的结果。这就像给模型加了一个“思维深度的调节钮”，既照顾成本，也给用户更大灵活性。

03｜怎么用？

和之前一样，新版 Gemini 2.5 Pro Preview 06-05 目前已经可以在谷歌 AI Studio 中免费体验。

百万上下文，多模态（甚至支持解析视频），顶级推理能力，再考虑到能免费用，Gemini 2.5 Pro 简直香到爆！

结语

没有过度宣传，也没有突然惊喜，谷歌 Gemini 一直是稳扎稳打、全面进化。

我是木易，一个专注AI领域的技术产品经理，国内Top2本科+美国Top10 CS硕士。

相信AI是普通人的“外挂”，致力于分享AI全维度知识。这里有最新的AI科普、工具测评、效率秘籍与行业洞察。

欢迎关注“AI信息Gap”，用AI为你的未来加速。

精选推荐

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。