谷歌刚刚更新!新版 Gemini 2.5 Pro:顶级推理 + 百万上下文还免费!

谷歌的 Gemini 2.5 Pro 又更新了,就在几小时前!

Gemini 模型这更新速度没谁了,几乎是一个月一次。

上个版本,是 5 月 6 日发布的 I/O 版。

今天发布的新版 Gemini 2.5 Pro 代号 gemini-2.5-pro-preview-06-05,已正式在 AI Studio、Vertex AI、Gemini App 全面开放试用。

尽管新模型还是 Preview,但它很可能就是几周后正式发布的长期稳定版本(GA,General Availability)。

也就是说,这是谷歌接下来一段时间里押注最重的旗舰模型。


01|版本信息小抄:上线时间、上下文、接入方式

  • 版本代号gemini-2.5-pro-preview-06-05

  • 上线时间:2025 年 6 月 5 日

  • 当前阶段:Public Preview,预计数周内升级为 GA 稳定版

  • 上下文窗口

    • 输入上限:1,048,576 tokens(真 100 万)

    • 输出上限:65,536 tokens(64 K)

  • 接入方式:Google AI Studio、Vertex AI、Gemini App

  • 新增特性:支持“thinking budget”(推理预算)—— 可以控制思考成本/响应时长


02|这次真有提升?几个值得注意的性能指标

推理能力:更强了!

这版 Gemini 模型在三个极难的基准测试上表现非常强:

  • HLE(高难度智力综合测试)

  • AIDER(代码与推理基准测试)

  • GPQA(研究生难度的问答测试)

在这些近乎 "竞赛级推理" 的测试中,06-05Gemini 2.5 Pro 跑赢了 o3Claude Opus 4Grok 3 以及 DeepSeek R1

用谷歌官方的话说:重回巅峰(回归 SOTA 水平)。

SOTA,“State of the Art”的缩写,意思是“当前最强水平”。

编码能力:WebDevArena 继续第一!

  • WebDevArena 榜单 Elo 分数从上一个版本的 1408 提升到了 1443,继续占据榜首。

  • AIDER Polyglot 等多语言代码基准中也稳居第一。

  • 特别适合构建 Web App、自动化 UI、写前端动效、动画播放器等。

  • 支持长代码上下文输入(100 万 tokens),能一口气跑完一整个项目文件。

响应质量:格式更整洁,回答更像“人话”

Google 官方在文档里明确提到,他们修复了 03-25 版本在非编码任务上的“回退问题”。

同时,在响应风格和结构上做了优化,回答格式更规整;更有创意。

除此之外,06-05 版本引入了一个新功能:“thinking budget”(思考预算)。

它允许你在每次使用模型时设定一个“预算范围”,来控制模型在推理阶段的资源(token)消耗。

预算越高,模型的推理就越深入全面;预算低时,它则倾向于给出更快速但可能浅显的结果。这就像给模型加了一个“思维深度的调节钮”,既照顾成本,也给用户更大灵活性。


03|怎么用?

和之前一样,新版 Gemini 2.5 Pro Preview 06-05 目前已经可以在谷歌 AI Studio 中免费体验。

百万上下文,多模态(甚至支持解析视频),顶级推理能力,再考虑到能免费用,Gemini 2.5 Pro 简直香到爆!


结语

没有过度宣传,也没有突然惊喜,谷歌 Gemini 一直是稳扎稳打、全面进化。


我是木易,一个专注AI领域的技术产品经理,国内Top2本科+美国Top10 CS硕士。

相信AI是普通人的“外挂”,致力于分享AI全维度知识。这里有最新的AI科普、工具测评、效率秘籍与行业洞察。

欢迎关注“AI信息Gap”,用AI为你的未来加速。


精选推荐

### Gemini 2.5 版本特性概述 Gemini 2.5 是一款基于先进技术和优化设计的多功能工具集合,涵盖了从模型推理到数据处理等多个领域。以下是该版本的主要特性和更新要点: #### 思考模型增强 Gemini 2.5 Pro 引入了一种全新的“思考模型”机制,在生成响应之前能够模拟人类逻辑推理过程[^1]。这种机制的核心在于通过强化学习和思维链提示(Chain-of-Thought)技术,使模型具备更强的信息分析能力和上下文理解力。具体表现为: - **任务分解**:将复杂的任务拆解为多个子步骤,并逐一验证每一步骤的准确性。 - **决策制定**:综合所有子步骤的结果,形成最终结论。 #### 数据库接口升级 为了满足大规模应用的需求,GeminiDB Mongo 接口进行了全面优化[^3]。新版本提供了以下改进: - **高容量支持**:单实例最大支持 96TB 存储空间。 - **协议兼容性**:完全兼容 MongoDB 协议,便于现有系统的无缝迁移。 - **部署灵活性**:新增副本集部署选项,提升数据可靠性和可用性。 - **服务化迁移**:简化跨环境的数据迁移操作,降低运维复杂度。 #### 流式数据管理 Pulsar 组件作为 Gemini 2.5 的重要组成部分,进一步增强了对无界数据的支持能力[^4]。主要特点包括: - **分片存储架构**:利用 BookKeeper 和 Broker 节点实现高效的数据分布与访问。 - **统一视图呈现**:即使底层数据分布在不同物理节点上,也能向用户提供一致性的查询体验。 - **自动数据迁移**:无需人工干预即可完成冷热数据之间的转换,显著降低了维护成本。 - **地理冗余保障**:新增跨地域复制功能,提高了全球范围内的业务连续性水平。 #### 实时数据分析能力 借鉴阿里巴巴集团内部的成功案例[^5],Gemini 2.5 还特别加强了针对海量实时数据的处理性能。借助 HybridDB for MySQL 等先进技术手段,可以轻松应对如下挑战: - 对万亿级别规模的数据执行亚秒级响应速度的多维度统计计算; - 同时保持与其他主流大数据框架的良好互操作性,例如 MaxCompute 和 Blink; ```python # 示例代码展示如何连接至 GeminiDB Mongo 并读取部分记录 from pymongo import MongoClient client = MongoClient('mongodb://localhost:27017/') db = client['gemini_db'] collection = db['sample_collection'] documents = collection.find().limit(10) for doc in documents: print(doc) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值