过去一周,AI及其相关领域在技术和商业层面上发生了多起重大事件,展示了AI技术的快速迭代。
(以下借助 DeepSeek-R1 & Grok 辅助生成)
中国AI领域的进展
-
Deepseek-V3-0324发布
2025年3月24日 Deepseek 发布混合专家(MoE)语言模型 Deepseek-V3-0324,总参数6710亿,每次激活370亿参数。
-
关键特征:
-
显著提升了推理性能,在MMLU-Pro(75.9→81.2,+5.3)、GPQA(59.1→68.4,+9.3)、AIME(39.6→59.4,+19.8)和LiveCodeBench(39.2→49.2,+10.0)等基准测试中表现优异。
-
增强了前端Web开发能力,生成的网页和游戏前端更具美观性。
-
优化了中文写作和搜索能力,适合中长篇写作和报告分析。
-
-
性能与基准:在aider的多语种基准测试中得分55%,仅次于Sonnet 3.7,成为第二佳非深度推理模型。
-
开放性:采用MIT许可证开源,托管在Hugging Face,允许开发者本地运行和进一步开发。
-
商业影响:该模型的低成本和高性能可能挑战西方模型的定价策略,增强中国在全球AI市场的竞争力。
-
通义千问2.5-VL-32B-Instruct发布
2025年3月24日阿里巴巴云(Qwen团队)发布多模态模型(视觉-语言)模型通义千问2.5-VL-32B-Instruct,参数规模320亿。-
关键特征:
-
支持文本和图像输入,优化了动态分辨率和帧率训练,增强视频理解能力。
-
通过强化学习优化,输出更符合人类偏好的详细、格式良好的回答。
-
显著提升了数学推理能力,图像理解和推理更细致。
-
-
性能与比较:在基准测试中优于Gemma 3-27B、Mistral Small 3.1 24B和GPT-4o-0513,适合64GB内存的设备运行。
-
开放性:采用Apache 2.0许可证开源,托管在Hugging Face,支持社区开发。
-
商业影响:填补了视觉-语言任务的市场需求,可能增强阿里巴巴云在多模态AI领域的全球影响力。
-
其他新模型发布
-
字节跳动的Doubao 1.5 Pro: 根据Here's A Look at Other Chinese AI Models Like DeepSeek,该模型于近期发布,月活跃用户6000万,声称在知识保留、编码、推理和中文处理方面优于ChatGPT-4o。
-
百度的Ernie X1和Ernie 4.5: 根据Five Chinese AI Models to Watch As China's AI Race Heats up,本月发布了Ernie X1(推理模型,声称性能与DeepSeek R1相当,价格仅一半)和Ernie 4.5(基础模型,声称在多个基准测试中优于GPT-4.5,价格仅为其1%)。
-
-
-
文心一言全面免费开放
百度宣布自4月1日起,文心一言PC端和APP端全面免费,新增超长文档处理、多语种对话和高级AI绘画功能,进一步降低企业及开发者使用门槛2。
-
Manus推出付费订阅计划和移动应用:
中国AI平台Manus于3月31日推出了付费订阅计划,起价为每月39美元,并发布了移动应用。Manus提供AI驱动的代理工具,可用于创建婚礼邀请网页或棒球比赛评分表等任务。根据TechCrunch的报道,订阅计划包括两个级别:39美元的计划提供3900个信用点和同时运行两个任务的能力;199美元的计划提供19900个信用点,同时运行五个任务,并享有高峰时段的优先访问权。
这标志着中国AI公司向商业化迈出了重要一步,可能增强其在全球AI市场中的竞争力,尤其是在代理AI工具领域。
美国AI领域的进展
-
微软扩展AI功能到Intel和AMD Copilot Plus PC:
微软于3月31日宣布,将AI功能扩展到配备Intel和AMD芯片的Copilot Plus PC上,包括实时字幕、Paint中的Cocreator和Photos中的AI图像编辑/生成工具。根据The Verge的报道,这些功能此前仅限于Qualcomm芯片的设备,现在通过最新的Windows 11更新可用。此外,Recall功能已在Intel和AMD设备上测试,但尚未广泛发布。
这一举措可能使AI技术更广泛地应用于不同硬件平台,降低AI应用的进入门槛。
-
谷歌推出Gemini 2.5实验性模型:
谷歌于3月31日将其实验性AI模型Gemini 2.5 Pro免费提供给所有用户,但免费用户有使用限制。这可能增加用户采用率并收集更多数据以改进模型,同时也可能推动AI应用的普及。
关键特征:
- 支持模拟推理,避免常见AI错误,在LMSYS Chatbot竞技场排行榜上名列前茅。
- 免费用户通过网页选择该模型,但无法上传文件,上下文窗口限制较低(付费版为100万令牌)。
商业影响:可能增加用户采用率并收集更多数据以改进模型,同时推动AI应用的普及。
-
亚马逊推出Nova Act和Alexa Plus:
亚马逊于3月31日推出了Nova Act,一个可控制网页浏览器并独立执行简单任务的AI代理。根据TechCrunch的报道,Nova Act由亚马逊的旧金山AGI实验室开发,将用于即将推出的Alexa+升级。Nova Act SDK允许开发者构建代理原型,在ScreenSpot Web Text基准测试中表现优于OpenAI和Anthropic的类似产品(94% vs 88%和90%)。
同时,Alexa Plus以早期访问形式推出,仅限于较新的Echo Show设备(8、10、15和21),费用为每月19.99美元或Prime会员免费。根据The Verge的报道,当前功能包括订购Uber、识别物体、起草电子邮件等,但缺少一些功能,如头脑风暴礼品创意或通过语音订购杂货。
这些举措显示亚马逊在AI代理和语音助手领域的积极布局,竞争对手包括OpenAI和Anthropic。
-
OpenAI扩展ChatGPT图像生成功能:
OpenAI于3月31日将其先进的ChatGPT图像生成功能扩展到所有用户,但免费用户有使用限制。根据Sam Altman 在X的帖子,由于高需求,免费用户将限制为每天3次生成,原因是“我们的GPU正在熔化”。根据TechCrunch的报道,该功能由GPT-4o驱动,可生成更精确和详细的图像,适用于所有用户层级,但免费用户的推出有所延迟。
这反映了AI资源管理的挑战,同时也显示了用户对新功能的热情。
-
OpenAI计划发布开源大模型
Sam Altman透露,OpenAI未来几个月将推出一款高性能开源大模型,旨在应对Meta、DeepSeek等开源社区的竞争压力
-
OpenAI完成400亿美元融资:
OpenAI于3月31日完成了由SoftBank领投的400亿美元融资,估值达到3000亿美元。根据The Verge的报道,初始10亿美元由SoftBank和投资者辛迪加提供,其余30亿美元计划在年底前到位,但需在年底前转为盈利公司,否则可能损失25%的交易。这创下了私人科技公司历史上的最大融资记录,显示投资者对AI技术的持续信心。
-
苹果全球开放AI功能:
苹果的“Apple Intelligence”新增简体中文支持,并扩展至Vision Pro设备,集成多模态交互和本地化推理能力,被视为消费端AI应用的里程碑
苹果于3月31日宣布,其AI系统Apple Intelligence扩展到更多语言和地区,包括法语、德语、意大利语、葡萄牙语(巴西)、西班牙语、日语、韩语、简体中文,以及新加坡和印度的本地化英语。根据Apple Newsroom的报道,这些功能通过iOS 18.4、iPadOS 18.4和macOS Sequoia 15.4提供,欧盟用户首次获得访问权,并扩展到Apple Vision Pro的初始功能(美国英语)。
这增强了苹果的全球市场渗透力,特别是在AI隐私和本地化方面的竞争优势。
行业动态与市场趋势
-
中国生成式AI大会北京站开幕
4月1日至2日,聚焦生成式AI在内容创作、工业设计等领域的应用案例,预计发布多项行业合作计划2。
-
企业转向低成本AI模型
部分企业(如Palo Alto Networks)开始采用DeepSeek等开源模型,成本仅为OpenAI的5%,推动AI商业化向性价比优先转型7。
-
存储芯片与AI硬件涨价潮
闪迪宣布存储芯片涨价超10%,科慕上调钛白粉价格(100美元/吨),反映AI算力基础设施需求激增对供应链的影响
政策与战略布局
-
中国强化AI基础设施投资
国资委提出超前布局未来产业,加速培育AI领域“启航企业”;华为昇腾云服务2024年收入增长6倍,盘古大模型在政务、工业等领域市占率第一78。
-
美国关税政策波及AI产业
特朗普计划4月2日公布“全面高关税”政策,或对AI芯片及硬件进口加征15%-20%关税,高盛预测此举将加剧科技股波动并延缓AI投资回报周期7。
-
中美AI治理合作呼声
基辛格遗作强调,中美需合作建立类似“国际原子能机构”的AI治理框架,解决技术对齐与外交协调的双重挑战
关键引用:
- Deepseek-V3-0324技术报告
- Deepseek-V3-0324模型页面
- 通义千问2.5-VL-32B-Instruct模型页面
- 通义千问2.5-VL-32B博客
- 微软扩展AI功能的报道
- 谷歌Gemini 2.5的报道
- 亚马逊Nova Act和Alexa Plus的报道
- 亚马逊Alexa Plus的报道
- OpenAI融资和图像生成的报道
- 苹果扩展Apple Intelligence的新闻
-
Manus launches paid subscription plans and a mobile app TechCrunch
-
ChatGPT's image-generation feature gets an upgrade TechCrunch
-
OpenAI just raised another $40 billion funding round The Verge