阿里Qwen2.5重回开源模型榜一王座；GPT-4o高级语音将在24日发布

整理 | 王启隆

出品 | AI 科技大本营（ID：rgznai100）

一分钟速览新闻点！

阿里 Qwen 2.5 72B 发布，重回开源模型榜一王座
“大模型竞技场”发布最新排名，o1 无悬念夺冠，DeepSeek 取得国内第一
最新爆料：GPT-4o 高级语音模式或将在 9 月 24 日全面开放
OpenAI 连续放宽 API 速率限制，当前已提高五倍
Genspark 推出 Autopilot Agent 异步 AI 智能体
黄仁勋和 Sam Altman 现身 T-Mobile 资本市场日
T-Mobile 宣布与 OpenAI 建立多年合作伙伴关系
YouTube Shorts 将整合谷歌的 AI 视频模型 Veo
Runway 与狮门影业达成合作，开创 AI 与电影行业合作新篇

国内外 AI 要闻

阿里 Qwen 2.5 72B 发布，重回开源模型榜一王座

今日，阿里发布一系列 Qwen 2.5 模型。包括：

Qwen 2.5: 0.5B, 1.5B, 3B, 7B, 14B, 32B, 以及 72B;

代码模型 Qwen 2.5-Coder: 1.5B, 7B, 即将推出的 32B;

数学模型 Qwen 2.5-Math: 1.5B, 7B, 以及 72B；

Qwen-Plus，Qwen-Turbo，Qwen-VL-Max 的 API。

其中，Qwen 2.5 72B 模型取得了出色的成绩，在 Livebench AI（针对八月问题）的测试中击败了 Llama-405b。不久后将公布其在九月挑战中的表现。Qwen 2.5 72B 得分高达 55.5，仅略低于 GPT-4o。虽然落后于 o1 模型和 Sonnet，但对于一个 72B 的开源模型来说，这是一个非常优异的成绩，它也因此重回开源模型榜一王座，被赞为 “世界上最好的开源模型”。

详细介绍：https://qwenlm.github.io/blog/qwen2.5/

“大模型竞技场”发布最新排名，o1 无悬念夺冠，DeepSeek 取得国内第一

今日，人称“大模型竞技场”的权威排行榜 @lmsysorg 发布了最新的 LLM 排名。在该榜单中，OpenAI 的 o1-preview 和 o1-mini 排名前两位，并且首次超越 1300 分。值得注意的是，国产模型 DeepSeek v2.5 取得了国内第一名的好成绩。

最新爆料：GPT-4o 高级语音模式或将在 9 月 24 日全面开放

科技媒体 testingcatalog 昨日发布博文，报道称 OpenAI 公司可能会在 9 月 24 日进一步推广 ChatGPT 的高级语音模式，甚至可能是直接正式发布。该媒体报道，OpenAI 公司已更新高级语音模式 FAQ 页面，在代码中被发现“hasSeenAdvancedVoice/2024-09-24”的字符串，暗示会邀请部分移动用户体验高级语音模式。

OpenAI 连续放宽 API 速率限制，当前已提高五倍

9 月 17 日，OpenAI Developers 发推表示，已提高 OpenAI o1 API 针对第 5 层级开发者的速率限制。其中，o1-preview 为每分钟 100 次请求，o1-mini 为每分钟 250 次请求。OpenAI 还表示将继续努力进一步提高速率限制并扩大对更多层级的访问。随后在 9 月 19 日（今日），OpenAI 再次发推称，刚刚又将速率限制提高了 5 倍，o1-preview 变为每分钟 500 次请求，o1-mini 变为每分钟 1000 次请求，进一步放宽了 API 限制。

Genspark 推出 Autopilot Agent 异步 AI 智能体

近日，Genspark 推出了 Autopilot Agent 异步 AI Agent（智能体）。该 Agent 能够在云端同时运行多个任务，实现异步处理，如同多个虚拟助手并行工作，减少用户等待时间，让用户能专注于更重要的事务。它还具备 Cross Check Agent 功能，可以快速审查和验证信息，例如在 6 分钟内就能检查 142 个信息来源，而这对于人类可能需要数小时才能完成，充分展现了 AI 在信息处理和验证方面的强大效率。此外，在进行任务时，Genspark 会提供智能内嵌截图，展示关键证据，使结果更加直观。未来，除了现有功能外，Genspark 还将推出更多新功能，如数据搜索等，并且多个 AI Agents 将协同工作，进一步提升自动化效率，帮助用户节省时间。

黄仁勋和 Sam Altman 现身 T-Mobile 资本市场日

T-Mobile Capital Markets Day 是 T-Mobile US 公司举办的资本市场日活动，这是一个面向投资者和分析师的重要活动，公司通常会在这一天分享其财务展望、战略规划、业务更新和未来目标。今日，黄仁勋和 Sam Altman 接连现身活进行讲话，主要内容如下。

黄仁勋：“NVIDIA 的新款 Blackwell GPU 将推理性能提高了 50 倍，这将辅助 OpenAI 的全新 o1 推理模型，并将推理响应时间从几分钟缩短到几秒。未来，我们很快将与数字智能体合作，如今成长起来的人们将拥有自己的 R2-D2 或 C-3PO，跟随他们度过一生，与他们一起学习。”

Sam Altman：“AI 推理仍处于 GPT-2 阶段，新的 o1 模型代表了 AI 发展的新范式，将使能力快速进步。”

T-Mobile 宣布与 OpenAI 建立多年合作伙伴关系

活动当天，T-Mobile US 还宣布与 OpenAI 合作，共同构建一个人工智能平台 IntentCX，旨在帮助电信公司获取和留住客户。该平台将从数百万使用 T-Life 应用的 T-Mobile 用户的交互数据中收集信息。

T-Life 应用于今年推出，通过单一门户整合了账单管理、智能手表集成和 T-Mobile Tuesdays 零售交易等多项现有服务。T-Mobile 表示，此次合作将帮助公司自动化一些通常需要到店或致电客服才能完成的任务，例如新平台将结合过去的服务呼叫数据和网络状态信息来解决客户问题。

T-Mobile 首席执行官 Mike Sievert 在旧金山的一次投资者演示中表示，如果客户因刚刚掉线而致电，人工智能可以接听该电话。过去客户流失的洞察也有助于防止未来的客户流失，在重视可靠收入流的电信行业中，防止用户流失是一个优先事项。Sievert 称，每个离开的客户都留下了关于他们离开原因的单独个性化数据线索，人工智能可以确定出了什么问题以及原因。双方表示，用于训练 IntentCX 的客户数据将是安全的，但对于科技巨头 OpenAI 将如何使用这些数据提供的细节很少。

OpenAI 首席执行官 Sam Altman 表示，公司不会使用企业客户的数据来 “训练” 其旗舰人工智能产品如 ChatGPT，他强调这是客户的数据，不会用于改进基础的 OpenAI 模型。这个人工智能技术平台预计将于 2025 年整合到 T-Mobile 的运营和交易系统中，作为协议的一部分，双方还将合作开发更多由人工智能支持的服务和工具。

YouTube Shorts 将整合谷歌的 AI 视频模型 Veo

在周三上午的 Made On YouTube 活动中，YouTube 宣布了一系列重要举措。其中，Google DeepMind 的 AI 视频生成模型 Veo 将被整合到 YouTube Shorts 中，这一整合将使创作者能够生成高质量的背景和六秒短片，对 “梦幻屏幕” 功能进行重大升级，还可以编辑和重新混合素材，为 Shorts 制作独立视频片段，预计今年晚些时候完成整合，并使用 SynthID 技术添加水印。此外，YouTube 还宣布了一系列新功能，包括在美国垂直直播中推出类似 TikTok “礼物” 的 “珠宝” 功能，扩展自动配音工具以支持更多语言并测试 “富有表现力的语音”，将社区中心扩展到更多频道，以及创作者可以在 YouTube Studio 中使用 AI 辅助构思视频、生成缩略图和回复粉丝。

Runway 与狮门影业达成合作，开创 AI 与电影行业合作新篇

近日，纽约 AI 初创公司 Runway 与狮门影业签署合作协议。双方将基于狮门影业超过 20000 部影视标题训练定制 AI 视频制作和编辑模型，这一合作似乎是首次大型电影制片厂与 AI 视频模型提供商的直接合作，可能给因 2023 年演员和编剧罢工而陷入动荡的电影行业带来更多冲击。Runway 在竞争激烈的 AI 视频模型领域有众多竞争对手，其产品具备故事板、背景创建和特效制作等功能，能为电影制作各个环节提供帮助。今年，Runway 动作不断，推出新的 API 和视频转视频功能，还举办了第三届年度电影竞赛。然而，Runway 也面临版权争议等问题，被指涉嫌大规模侵犯版权，批评者认为其应承担赔偿责任或在使用公开材料前获得许可。