Manus横空出世，阿里开源QwQ-32B，豆包深度思考，字节发布Trae国内版！| AI Weekly 3.3-3.9

最新推荐文章于 2025-04-22 14:12:02 发布

AI信息Gap

最新推荐文章于 2025-04-22 14:12:02 发布

阅读量889

点赞数 7

文章标签：开源人工智能 DeepSeek 深度学习 chatgpt 机器学习

本文链接：https://blog.csdn.net/weixin_40774379/article/details/146123555

版权

📢本周AI快讯 | 1分钟速览🚀

1️⃣ 🤖 Manus 横空出世 ：国内首款通用型 AI Agent，多代理协作架构，可自主完成 PPT 制作等复杂任务，但面临技术创新性质疑。

2️⃣ 🧠 阿里开源 QwQ-32B ：320亿参数模型性能可媲美6710亿参数的 DeepSeek R1，在多项评测中表现卓越，已开源免费使用。

3️⃣ 💭 豆包推出"深度思考" ：字节跳动上线推理模式，展示模型解决问题的完整思考过程，覆盖问答、搜索、写作和阅读场景。

4️⃣ 💻 字节发布 Trae 国内版 ：中国首个 AI 原生 IDE，内置豆包1.5-pro，支持切换 DeepSeek R1 和 V3 模型，已提供 Mac 和 Windows 版本。

5️⃣ 🔄 OpenAI 开放 GPT-4.5 ：向 ChatGPT Plus 用户开放，减少幻觉现象，可能是最后一个非"链式思维"模型。

6️⃣ 👨‍💻 ChatGPT 支持 IDE 编辑 ：macOS 版更新允许直接在 Xcode、VS Code 等环境中编辑代码，添加"自动应用"模式。

7️⃣ 📈 ChatGPT 用户量翻倍 ：周活跃用户半年内从2亿增至4亿，增长主要得益于新模型和多模态能力。

8️⃣ 💰 Anthropic 完成 35 亿美元融资 ：估值达 615 亿美元，计划推进下一代 AI 系统开发，扩大计算能力。

9️⃣ 📝 Mistral 推出 OCR API ：在光学字符识别领域表现优异，每千页 1 美元，单节点每分钟处理 2000 页。

1️⃣0️⃣ 🚀 Mistral 计划推新模型 ：计划推出超越 DeepSeek 的开源模型，强调开源策略帮助较小公司与巨头竞争。

1. Manus 横空出世：技术突破 vs 过度营销

3月6日，一个国内团队发布了通用型 AI Agent 产品——Manus，引发了广泛关注和讨论。作为全球首款通用 AI Agent，Manus 展示了在任务执行和用户体验方面的创新。

主要特点：

自主任务执行：Manus 能够根据用户的简单指令，独立完成复杂任务。例如，有用户仅提供一句提示词，Manus 即可自主收集信息，生成十页的 PPT。在另一案例中，用户要求分析特斯拉股票并制作 PPT，Manus 在 40 多分钟后交付了一份 31 页的 PPT 和详尽的分析报告，包含丰富的图表和多维度分析。
多代理协作架构：Manus 采用多代理架构，在独立的虚拟机中运行，通过规划代理、执行代理和验证代理的分工协作机制，提高了处理复杂任务的效率，并通过并行计算缩短响应时间。

市场反应：

Manus 的发布在中文互联网引起了热烈讨论。邀请码供不应求，甚至被炒至高价，显示出市场对这一新产品的浓厚兴趣。然而，值得注意的是，尽管产品发布使用的是英文，但在海外 AI 社区中，Manus 的关注度相对较低。

质疑与挑战：

尽管 Manus 展示了令人印象深刻的功能，但也面临一些质疑：

技术创新性：有观点认为，Manus 的核心架构与 Anthropic 的“Computer Use”高度相似，均依赖多代理虚拟机环境完成任务。其所谓的“自主规划”能力，实则是基于现有大语言模型的调用，并未展示底层技术的突破。
过度营销的质疑：Manus 的邀请码机制被部分人士视为“饥饿营销”，引发了对其营销策略的讨论。此外，产品发布后自媒体的广泛宣传，也让一些业内人士质疑其存在过度营销之嫌。

2. 阿里推出并开源 QwQ-32B 推理模型

阿里于 2025 年 3 月 6 日正式发布并开源了最新的推理模型——通义千问 QwQ-32B。该模型拥有 320 亿参数，但在性能上可与拥有 6710 亿参数的 DeepSeek R1 相媲美。

QwQ-32B 在多项关键评测中表现卓越。在测试数学能力的 AIME24 评测集以及评估代码能力的 LiveCodeBench 中，QwQ-32B 的表现与 DeepSeek R1 相当，远超 o1-mini 及相同尺寸的 R1 蒸馏模型。此外，在由 Meta 首席科学家杨立昆领衔的 LiveBench、谷歌提出的指令遵循能力 IFEval 评测集，以及加州大学伯克利分校提出的 BFCL 测试中，QwQ-32B 的得分均超越了 DeepSeek R1。

值得一提的是，QwQ-32B 的参数量仅为 DeepSeek R1 的约 1/20，但在性能上实现了比肩。目前，QwQ-32B 已在 Hugging Face 和 ModelScope 等平台开源，采用 Apache 2.0 协议，开发者和企业可以免费下载模型进行本地部署，或通过阿里云百炼平台直接调用模型 API 服务。

3. 字节豆包上线「深度思考」推理模式

2025 年 3 月 5 日，字节跳动旗下 AI 助手豆包正式推出「深度思考」推理模式，旨在提升用户在问答、搜索、写作和阅读等场景下的交互体验。用户只需在输入框中启用「深度思考 Beta」开关，即可进入该模式。在此模式下，豆包会展示其思考过程，包括自我质疑、假设验证和错误修正等步骤，使用户能够直观了解模型解决问题的逻辑链条。例如，在解决数学题时，模型会展示从问题拆解、多方法验证到最终结论的全过程。

此前，豆包团队在发布豆包 1.5 Pro 时曾宣布了深度推理模型 Doubao-1.5-pro-AS1-Preview 的存在，并表示通过强化学习算法的突破和工程优化，研发了豆包深度思考模式。

4. 字节跳动发布 Trae 国内版

2025 年 3 月 3 日，字节跳动正式发布了中国首个 AI 原生集成开发环境（IDE）—— Trae 国内版。该工具内置了 豆包 1.5-pro 大模型，并支持切换至满血版 DeepSeek R1 和 V3 模型。

作为国内首个 AI 原生 IDE，Trae 国内版具备强大的上下文感知能力，能够理解整个项目代码，帮助开发者应对复杂的技术挑战。此前，字节跳动于今年 1 月推出了 Trae 国际版，此次发布的国内版针对中国开发场景进行了适配优化。未来，Trae 还计划支持模型自定义功能，用户可根据需求接入不同的模型 API。

目前，Trae 国内版已提供 Mac 和 Windows 版本下载，Linux 版本也已开放预约。

5. OpenAI 向 ChatGPT Plus 用户开放 GPT-4.5

OpenAI 于 2025 年 2 月 27 日发布了最新的生成式 AI 模型 GPT-4.5，现已向 ChatGPT Plus 订阅用户开放。该模型旨在提升用户体验，提供更自然的交互、更广泛的知识库，并更好地理解用户意图。与之前的版本相比，GPT-4.5 显著减少了“幻觉”现象，即 AI 生成的事实性错误。然而，OpenAI 首席执行官 Sam Altman 指出，尽管 GPT-4.5 在某些方面有所改进，但它并非逻辑推理 AI，在某些测试中可能未必优于竞争对手。

值得注意的是，GPT-4.5 可能是 OpenAI 最后一个非“链式思维”模型，未来的开发将更注重增强 AI 的推理能力。Altman 强调，公司计划简化产品线，将 GPT 系列与 o 系列模型合并，打造能够高效处理多种任务的综合系统。目前，GPT-4.5 已向 ChatGPT Plus 用户开放，未来将逐步推广至其他用户群体。

6. ChatGPT macOS 版支持在 IDE 中直接编辑代码

OpenAI 于 2025 年 3 月 6 日发布了 macOS 版 ChatGPT 的重要更新，使开发者能够直接在 Xcode、VS Code 等集成开发环境（IDE）中编辑代码，旨在简化编码流程，提高工作效率。

更新后的 ChatGPT 应用引入了“与应用程序协作”功能，用户可通过快捷键 CMD+Z 唤出 ChatGPT，应用会自动检测当前活跃的编辑器（如 Xcode），并根据上下文与用户交互。此外，新增的“自动应用”模式允许 ChatGPT 在无需用户额外授权的情况下直接编辑代码。

目前，该更新已向 ChatGPT Plus、Pro 和 Team 订阅用户开放，企业版、教育版和免费用户将于下周获得支持。

7. ChatGPT 周活跃用户半年内翻倍

根据美国风险投资公司安德森·霍洛维茨（a16z）于 3 月 6 日发布的最新报告，OpenAI 的 ChatGPT 在 2024 年下半年恢复了强劲的增长势头。报告显示，ChatGPT 从 2023 年 11 月的每周活跃用户 1 亿增长至 2024 年 8 月的 2 亿，花费了 9 个月时间；而如今，用户数在不到 6 个月内又实现了翻倍。

自 2022 年 11 月发布以来，ChatGPT 迅速成为历史上最快达到 1 亿月活跃用户的应用，仅用时 2 个月。截至 2025 年 2 月，ChatGPT 的每周活跃用户已达到 4 亿，较 2024 年 12 月的 3 亿增长了 33%。

a16z 分析认为，ChatGPT 近期的增长主要得益于新模型和新功能的发布，特别是多模态能力的 GPT-4o。该版本发布后，2024 年 4 月至 5 月期间，ChatGPT 的使用量迅速上升。随后，在高级语音模式推出后，2024 年 7 月至 8 月期间，使用量再次增长。o1 系列模型的推出也促使 2024 年 9 月至 10 月的使用量进一步上升。

在移动端，ChatGPT 的增长相对更加稳定。报告指出，过去一年，ChatGPT 移动应用的用户每月增长 5% 至 15%，目前 4 亿周活跃用户中的 1.75 亿通过移动设备访问该应用。

8. Anthropic 完成 35 亿美元 E 轮融资

人工智能初创公司 Anthropic 于 2025 年 3 月 3 日宣布完成 35 亿美元的 E 轮融资，使公司估值达到 615 亿美元。本轮融资由 Lightspeed Venture Partners 领投，其他参与者包括思科投资、Fidelity、D1 Capital Partners、General Catalyst、Jane Street 和 Salesforce Ventures 等。

Anthropic 成立于 2021 年，由前 OpenAI 员工创立，致力于开发安全可靠的人工智能系统。公司计划利用此次融资推进下一代 AI 系统的开发，扩大计算能力，深化在机械可解释性和一致性方面的研究，并加速国际扩张。此前，Anthropic 推出了最新的 AI 模型 Claude 3.7 Sonnet，以其先进的推理能力和安全性著称。

此次融资使 Anthropic 的估值大幅提升，公司计划在未来数月内进一步提升大模型的编程能力，专注于开发可与人类团队协作处理复杂项目的 AI 系统。

9. Mistral AI 推出 Mistral OCR API

Mistral AI 于 3 月 6 日发布了全新的 Mistral OCR API，声称在光学字符识别（OCR）领域达到了前所未有的速度和准确性。该 API 具备强大的多模态文档处理能力，能够从 PDF、幻灯片、数学表达式、LaTeX 学术文档等复杂元素中高效提取文本内容，并以 Markdown 格式清晰呈现。

Mistral OCR 模型支持解析、理解和转录数千种脚本、字体和语言。根据官方数据，其识别性能优于谷歌 Document AI、微软 Azure OCR、OpenAI GPT-4o 等竞争者。值得关注的是，Mistral AI 将该 OCR 模型作为其聊天机器人 Le Chat 的默认文档理解工具，API 定价为每千页 1 美元，单节点每分钟可处理 2000 页。目前，该模型已应用于历史文化遗产保护等领域。

10. Mistral AI 计划推出超越 DeepSeek 的新模型

法国人工智能初创公司 Mistral AI 正积极采用开源策略，计划发布一款性能有望超越 DeepSeek 的新模型。

Mistral AI 首席执行官 Arthur Mensch 在巴塞罗那举行的世界移动通信大会上表示，公司即将推出“非常强大的模型”，这些模型有潜力在性能上超过 DeepSeek。Mensch 强调，开源模式能帮助较小的公司相互学习并优化模型，从而与 OpenAI 等规模更大、资金更雄厚的竞争对手展开竞争。他还表示，将 DeepSeek 看作是开源生态中的贡献者而非竞争者，强调开源环境中的企业互助关系。

自 2023 年成立以来，Mistral AI 已经筹集了超过 10 亿美元资金，并着手建设数据中心，积极推动法国的 AI 基础设施建设以及数据主权。此前，法国总统埃马纽埃尔·马克龙表示，未来几年，私营部门将在法国 AI 领域投资 1090 亿欧元，这与 Mistral AI 的发展方向高度契合。尽管 Mistral AI 的资金规模与美国科技巨头仍有一定差距，但公司已实现了可观收入，未来将进一步扩大业务规模，持续通过开源模式增强其模型的竞争力。