Gemini API 最新进展：Gemini 2.5 Flash & Pro、Live API、Veo 2

Android 开发者

于 2025-04-11 10:30:42 发布

阅读量261

点赞数

CC 4.0 BY-SA版权

原文链接：https://mp.weixin.qq.com/s?__biz=Mzk0NDIwMTExNw==&mid=2247596384&idx=1&sn=317a34c8fdbf2015e10f1557533b42de&chksm=c242542286653cb9fad2e613772192f715ff0a1183a60812cc4e01ae3709419722b7dc6f9650&scene=126&sessionid=0

作者 / DeepMind 高级开发者关系经理 Joana Carrasqueira

今年的 Cloud Next 大会上，我们推出了一系列突破性更新与强大功能，旨在赋能广大开发者，与大家携手共创人工智能的未来。本次发布亮点包括：最新的 Gemini 2.5 思考模型，实时互动体验的 Live API 的最新进展，以及正式面向开发者开放的高质量视频生成工具 Veo 2。近期，我们面向在 Google AI Studio 中使用 Gemini API 的开发者推出了许多不容错过的重要更新，一起来看看吧。

🔗 Cloud Next

https://cloud.withgoogle.com/next/25

🔗 Google AI Studio

http://aistudio.google.com

Gemini 2.5：构建新一代应用

我们近期推出了 Gemini 2.5 Pro，这是我们迄今为止性能最佳的 AI 模型，能展示出思考模型在生成响应之前进行推理的能力。作为我们迄今为止最先进的编码模型，Gemini 2.5 Pro 能打造引人注目的 Web 应用，在开发智能体编程应用方面也表现出色。

🔗 Gemini 2.5 Pro

https://blog.google/technology/google-deepmind/gemini-model-thinking-updates-march-2025/#gemini-2-5-thinking

🔗 思考模型

https://ai.google.dev/gemini-api/docs/thinking#prompting-techniques

Gemini 2.5 Pro 已经开始赋能在 Google AI Studio 中使用 Gemini API 构建应用的开发者，以及使用 Vertex AI 的企业客户。

🔗 Google AI Studio

https://aistudio.google.com/prompts/new_chat?model=gemini-2.5-pro-preview-03-25

🔗 Gemini API

https://ai.google.dev/gemini-api/docs/models#gemini-2.5-pro-preview-03-25

🔗 Vertex AI

https://cloud.google.com/blog/products/ai-machine-learning/gemini-2-5-pro-flash-on-vertex-ai

同时，我们宣布 Gemini 2.5 Flash 即将推出。作为我们热门主力模型的演进版本，Gemini 2.5 Flash 在保持低延迟和高性价比的同时，融入了强大的思考能力。

这标志着我们朝着实现所有 Gemini 模型具备自适应思考能力这一愿景，迈出了重要一步。Gemini 2.5 模型为应用开发开辟了诸多全新的应用场景，包括支持更强大的智能体，管理多智能体系统，加速编码辅助，以及利用高达 100 万 token 的上下文输入窗口，实现对整个代码库的生成式推理。

🔗 管理多智能体系统

https://cloud.google.com/blog/products/ai-machine-learning/build-and-manage-multi-system-agents-with-vertex-ai

Veo 2 可用于生产环境

我们很高兴地宣布，Gemini API 中的 Veo 2 现已正式面向生产环境开放使用。Veo 2 具备遵循简单及复杂指令的能力，并能以丰富的视觉风格模拟真实世界的物理效果。Veo 2 使开发者能够直接使用文本和图像提示，在应用中生成高质量视频内容：

文本到视频 (t2v)：通过文本描述生成视频。
图像到视频 (i2v)：从图像生成视频，并支持可选的文本提示，以实现更精准的指导。

以 Wolf Games 为例，该公司正在构建一个生成式游戏平台，旨在创造高度个性化的互动叙事游戏体验。借助 Veo 2，他们得以构建出极具动态表现力的电影级游戏场景，显著提升了视频的真实感、动作准确度和镜头控制。Wolf Games 表示，Veo 2 将其获取理想视觉效果所需的迭代次数减少了 60% 以上，并大幅缩短了制作周期，从而加速了创意蓝图的实现。

🔗 Wolf Games

https://techcrunch.com/2025/03/12/wolf-games-backed-by-law-order-creator-uses-ai-to-create-murder-mystery-games/

即日起，您便可在 Google AI Studio 的 Gemini API 中使用 Veo 2：