📢本周AI快讯 | 1分钟速览🚀
1️⃣ 🤖 Manus 横空出世 :国内首款通用型 AI Agent,多代理协作架构,可自主完成 PPT 制作等复杂任务,但面临技术创新性质疑。
2️⃣ 🧠 阿里开源 QwQ-32B :320亿参数模型性能可媲美6710亿参数的 DeepSeek R1,在多项评测中表现卓越,已开源免费使用。
3️⃣ 💭 豆包推出"深度思考" :字节跳动上线推理模式,展示模型解决问题的完整思考过程,覆盖问答、搜索、写作和阅读场景。
4️⃣ 💻 字节发布 Trae 国内版 :中国首个 AI 原生 IDE,内置豆包1.5-pro,支持切换 DeepSeek R1 和 V3 模型,已提供 Mac 和 Windows 版本。
5️⃣ 🔄 OpenAI 开放 GPT-4.5 :向 ChatGPT Plus 用户开放,减少幻觉现象,可能是最后一个非"链式思维"模型。
6️⃣ 👨💻 ChatGPT 支持 IDE 编辑 :macOS 版更新允许直接在 Xcode、VS Code 等环境中编辑代码,添加"自动应用"模式。
7️⃣ 📈 ChatGPT 用户量翻倍 :周活跃用户半年内从2亿增至4亿,增长主要得益于新模型和多模态能力。
8️⃣ 💰 Anthropic 完成 35 亿美元融资 :估值达 615 亿美元,计划推进下一代 AI 系统开发,扩大计算能力。
9️⃣ 📝 Mistral 推出 OCR API :在光学字符识别领域表现优异,每千页 1 美元,单节点每分钟处理 2000 页。
1️⃣0️⃣ 🚀 Mistral 计划推新模型 :计划推出超越 DeepSeek 的开源模型,强调开源策略帮助较小公司与巨头竞争。
1. Manus 横空出世:技术突破 vs 过度营销
3月6日,一个国内团队发布了通用型 AI Agent 产品——Manus,引发了广泛关注和讨论。作为全球首款通用 AI Agent,Manus 展示了在任务执行和用户体验方面的创新。
主要特点:
-
自主任务执行:Manus 能够根据用户的简单指令,独立完成复杂任务。例如,有用户仅提供一句提示词,Manus 即可自主收集信息,生成十页的 PPT。在另一案例中,用户要求分析特斯拉股票并制作 PPT,Manus 在 40 多分钟后交付了一份 31 页的 PPT 和详尽的分析报告,包含丰富的图表和多维度分析。
-
多代理协作架构:Manus 采用多代理架构,在独立的虚拟机中运行,通过规划代理、执行代理和验证代理的分工协作机制,提高了处理复杂任务的效率,并通过并行计算缩短响应时间。
市场反应:
Manus 的发布在中文互联网引起了热烈讨论。邀请码供不应求,甚至被炒至高价,显示出市场对这一新产品的浓厚兴趣。然而,值得注意的是,尽管产品发布使用的是英文,但在海外 AI 社区中,Manus 的关注度相对较低。
质疑与挑战:
尽管 Manus 展示了令人印象深刻的功能,但也面临一些质疑:
-
技术创新性:有观点认为,Manus 的核心架构与 Anthropic 的“Computer Use”高度相似,均依赖多代理虚拟机环境完成任务。其所谓的“自主规划”能力,实则是基于现有大语言模型的调用,并未展示底层技术的突破。
-
过度营销的质疑:Manus 的邀请码机制被部分人士视为“饥饿营销”,引发了对其营销策略的讨论。此外,产品发布后自媒体的广泛宣传,也让一些业内人士质疑其存在过度营销之嫌。
2. 阿里推出并开源 QwQ-32B 推理模型
阿里于 2025 年 3 月 6 日正式发布并开源了最新的推理模型——通义千问 QwQ-32B
。该模型拥有 320 亿参数,但在性能上可与拥有 6710 亿参数的 DeepSeek R1
相媲美。
QwQ-32B
在多项关键评测中表现卓越。在测试数学能力的 AIME24 评测集以及评估代码能力的 LiveCodeBench 中,QwQ-32B
的表现与 DeepSeek R1
相当,远超 o1-mini
及相同尺寸的 R1 蒸馏模型。此外,在由 Meta 首席科学家杨立昆领衔的 LiveBench、谷歌提出的指令遵循能力 IFEval 评测集,以及加州大学伯克利分校提出的 BFCL 测试中,QwQ-32B
的得分均超越了 DeepSeek R1
。
值得一提的是,QwQ-32B
的参数量仅为 DeepSeek R1
的约 1/20,但在性能上实现了比肩。目前,QwQ-32B 已在 Hugging Face 和 ModelScope 等平台开源,采用 Apache 2.0 协议,开发者和企业可以免费下载模型进行本地部署,或通过阿里云百炼平台直接调用模型 API 服务。
3. 字节豆包上线「深度思考」推理模式
2025 年 3 月 5 日,字节跳动旗下 AI 助手豆包正式推出「深度思考」推理模式,旨在提升用户在问答、搜索、写作和阅读等场景下的交互体验。用户只需在输入框中启用「深度思考 Beta」开关,即可进入该模式。在此模式下,豆包会展示其思考过程,包括自我质疑、假设验证和错误修正等步骤,使用户能够直观了解模型解决问题的逻辑链条。例如,在解决数学题时,模型会展示从问题拆解、多方法验证到最终结论的全过程。
此前,豆包团队在发布豆包 1.5 Pro 时曾宣布了深度推理模型 Doubao-1.5-pro-AS1-Preview
的存在,并表示通过强化学习算法的突破和工程优化,研发了豆包深度思考模式。
4. 字节跳动发布 Trae 国内版
2025 年 3 月 3 日,字节跳动正式发布了中国首个 AI 原生集成开发环境(IDE)—— Trae 国内版。该工具内置了 豆包 1.5-pro
大模型,并支持切换至满血版 DeepSeek R1
和 V3
模型。
作为国内首个 AI 原生 IDE,Trae 国内版具备强大的上下文感知能力,能够理解整个项目代码,帮助开发者应对复杂的技术挑战。此前,字节跳动于今年 1 月推出了 Trae 国际版,此次发布的国内版针对中国开发场景进行了适配优化。未来,Trae 还计划支持模型自定义功能,用户可根据需求接入不同的模型 API。
目前,Trae 国内版已提供 Mac 和 Windows 版本下载,Linux 版本也已开放预约。
5. OpenAI 向 ChatGPT Plus 用户开放 GPT-4.5
OpenAI 于 2025 年 2 月 27 日发布了最新的生成式 AI 模型 GPT-4.5
,现已向 ChatGPT Plus 订阅用户开放。该模型旨在提升用户体验,提供更自然的交互、更广泛的知识库,并更好地理解用户意图。与之前的版本相比,GPT-4.5
显著减少了“幻觉”现象,即 AI 生成的事实性错误。然而,OpenAI 首席执行官 Sam Altman 指出,尽管 GPT-4.5
在某些方面有所改进,但它并非逻辑推理 AI,在某些测试中可能未必优于竞争对手。
值得注意的是,GPT-4.5
可能是 OpenAI 最后一个非“链式思维”模型,未来的开发将更注重增强 AI 的推理能力。Altman 强调,公司计划简化产品线,将 GPT 系列与 o 系列模型合并,打造能够高效处理多种任务的综合系统。目前,GPT-4.5
已向 ChatGPT Plus 用户开放,未来将逐步推广至其他用户群体。
6. ChatGPT macOS 版支持在 IDE 中直接编辑代码
OpenAI 于 2025 年 3 月 6 日发布了 macOS 版 ChatGPT 的重要更新,使开发者能够直接在 Xcode、VS Code 等集成开发环境(IDE)中编辑代码,旨在简化编码流程,提高工作效率。
更新后的 ChatGPT 应用引入了“与应用程序协作”功能,用户可通过快捷键 CMD+Z 唤出 ChatGPT,应用会自动检测当前活跃的编辑器(如 Xcode),并根据上下文与用户交互。 此外,新增的“自动应用”模式允许 ChatGPT 在无需用户额外授权的情况下直接编辑代码。
目前,该更新已向 ChatGPT Plus、Pro 和 Team 订阅用户开放,企业版、教育版和免费用户将于下周获得支持。
7. ChatGPT 周活跃用户半年内翻倍
根据美国风险投资公司安德森·霍洛维茨(a16z)于 3 月 6 日发布的最新报告,OpenAI 的 ChatGPT 在 2024 年下半年恢复了强劲的增长势头。 报告显示,ChatGPT 从 2023 年 11 月的每周活跃用户 1 亿增长至 2024 年 8 月的 2 亿,花费了 9 个月时间;而如今,用户数在不到 6 个月内又实现了翻倍。
自 2022 年 11 月发布以来,ChatGPT 迅速成为历史上最快达到 1 亿月活跃用户的应用,仅用时 2 个月。 截至 2025 年 2 月,ChatGPT 的每周活跃用户已达到 4 亿,较 2024 年 12 月的 3 亿增长了 33%。
a16z 分析认为,ChatGPT 近期的增长主要得益于新模型和新功能的发布,特别是多模态能力的 GPT-4o
。 该版本发布后,2024 年 4 月至 5 月期间,ChatGPT 的使用量迅速上升。随后,在高级语音模式推出后,2024 年 7 月至 8 月期间,使用量再次增长。o1
系列模型的推出也促使 2024 年 9 月至 10 月的使用量进一步上升。
在移动端,ChatGPT 的增长相对更加稳定。报告指出,过去一年,ChatGPT 移动应用的用户每月增长 5% 至 15%,目前 4 亿周活跃用户中的 1.75 亿通过移动设备访问该应用。
8. Anthropic 完成 35 亿美元 E 轮融资
人工智能初创公司 Anthropic 于 2025 年 3 月 3 日宣布完成 35 亿美元的 E 轮融资,使公司估值达到 615 亿美元。本轮融资由 Lightspeed Venture Partners 领投,其他参与者包括思科投资、Fidelity、D1 Capital Partners、General Catalyst、Jane Street 和 Salesforce Ventures 等。
Anthropic 成立于 2021 年,由前 OpenAI 员工创立,致力于开发安全可靠的人工智能系统。公司计划利用此次融资推进下一代 AI 系统的开发,扩大计算能力,深化在机械可解释性和一致性方面的研究,并加速国际扩张。此前,Anthropic 推出了最新的 AI 模型 Claude 3.7 Sonnet
,以其先进的推理能力和安全性著称。
此次融资使 Anthropic 的估值大幅提升,公司计划在未来数月内进一步提升大模型的编程能力,专注于开发可与人类团队协作处理复杂项目的 AI 系统。
9. Mistral AI 推出 Mistral OCR API
Mistral AI 于 3 月 6 日发布了全新的 Mistral OCR API,声称在光学字符识别(OCR)领域达到了前所未有的速度和准确性。 该 API 具备强大的多模态文档处理能力,能够从 PDF、幻灯片、数学表达式、LaTeX 学术文档等复杂元素中高效提取文本内容,并以 Markdown 格式清晰呈现。
Mistral OCR 模型支持解析、理解和转录数千种脚本、字体和语言。根据官方数据,其识别性能优于谷歌 Document AI、微软 Azure OCR、OpenAI GPT-4o
等竞争者。 值得关注的是,Mistral AI 将该 OCR 模型作为其聊天机器人 Le Chat 的默认文档理解工具,API 定价为每千页 1 美元,单节点每分钟可处理 2000 页。 目前,该模型已应用于历史文化遗产保护等领域。
10. Mistral AI 计划推出超越 DeepSeek 的新模型
法国人工智能初创公司 Mistral AI 正积极采用开源策略,计划发布一款性能有望超越 DeepSeek 的新模型。
Mistral AI 首席执行官 Arthur Mensch 在巴塞罗那举行的世界移动通信大会上表示,公司即将推出“非常强大的模型”,这些模型有潜力在性能上超过 DeepSeek。Mensch 强调,开源模式能帮助较小的公司相互学习并优化模型,从而与 OpenAI 等规模更大、资金更雄厚的竞争对手展开竞争。他还表示,将 DeepSeek 看作是开源生态中的贡献者而非竞争者,强调开源环境中的企业互助关系。
自 2023 年成立以来,Mistral AI 已经筹集了超过 10 亿美元资金,并着手建设数据中心,积极推动法国的 AI 基础设施建设以及数据主权。此前,法国总统埃马纽埃尔·马克龙表示,未来几年,私营部门将在法国 AI 领域投资 1090 亿欧元,这与 Mistral AI 的发展方向高度契合。尽管 Mistral AI 的资金规模与美国科技巨头仍有一定差距,但公司已实现了可观收入,未来将进一步扩大业务规模,持续通过开源模式增强其模型的竞争力。
我是木易,一个专注AI领域的技术产品经理,国内Top2本科+美国Top10 CS硕士。
相信AI是普通人的“外挂”,致力于分享AI全维度知识。这里有最新的AI科普、工具测评、效率秘籍与行业洞察。
欢迎关注“AI信息Gap”,用AI为你的未来加速。