AI周刊丨本周不可错过的AI行业动态（5.19-5.25）

本文链接：https://blog.csdn.net/weixin_49199926/article/details/148233218

大家好，这里是K姐。

一个帮助你把AI真正用起来的女子。

本篇内容，带你快速了解本周AI热点资讯。

AI大事件

Google I/O 2025 开发者大会，从研究到现实，AI技术全面升级

Google I/O 2025 大会宣布多项进展。

Gemini 2.5 Pro模型在LMArena排行榜首位，性能卓越。

推出Google Beam视频通信平台，提供沉浸式3D体验。
Gemini Live整合Project Astra功能，Agent Mode助力任务执行。
个性化智能回复将推出，AI Mode重塑搜索体验。

全新Imagen 4生成细节超逼真。
Veo 3首次实现音视频融合。凭借其逼真的场景、可控的角色一致性、声音合成及多样的编辑功能，在AI视频生成领域树立了新的标杆。

Anthropic发布史上最强AI模型Claude 4

Anthropic发布Claude 4模型 (包括Claude Opus 4和Claude Sonnet 4)。

该模型被誉为“史上最强AI模型”及“世界最佳编程模型”，具备分析数千数据源、长时间执行任务、编写接近人类水平内容和复杂操作的能力。

它采用了全新的混合推理架构，能在SWE-Bench Verified测试中取得72.5%成绩，Terminal-bench测试中取得43.2%成绩，并具备长达7小时的持续工作能力。

OpenAI最大收购，65亿美元拿下苹果前高管Jony Ive公司io

OpenAI宣布以约65亿美元收购由CEO Sam Altman与前苹果首席设计官Jony Ive联合创办的AI设备初创公司io。

这笔收购将是OpenAI史上最大一笔交易，预计夏季完成，需监管部门批准。

收购后，OpenAI将获得约55名顶尖硬件工程师、软件开发者和制造专家，包括多位曾参与iPhone设计的前苹果设计师。

微软Build 2025大会：拥抱MCP协议，引入xAI大模型

微软在Build 2025大会上宣布全面支持模型上下文协议（MCP），并与GitHub共同加入MCP指导委员会，推动开放标准落地。其智能体方案已覆盖超过23万家机构。

同时，微软公司宣布把埃隆·马斯克的xAI公司的Grok 3和Grok 3 mini人工智能模型引入Azure AI Foundry平台，作为微软在公司云平台内直接托管和收费的新产品。

OpenAI等科技巨头将在阿联酋建设人工智能基础设施集群

OpenAI、英伟达等科技巨头将携手合作，在阿拉伯联合酋长国建设一座名为“星际之门阿联酋”（Stargate UAE）的人工智能基础设施集群。

这一项目是OpenAI、软银和甲骨文今年1月宣布在美国建设人工智能基础设施计划的姊妹项目，预计第一阶段的200兆瓦人工智能“集群”将于2026年投入使用。

新产品发布

豆包上线视频通话功能：支持实时视频问答互动

豆包App实时通话功能升级，支持视频聊天问答。

本次升级基于视觉推理模型，支持联网搜索，工作、生活和学习遇到问题，随时和豆包视频对话。

该功能具有实时场景理解能力，通过摄像头捕捉用户周围环境，结合问题进行智能分析。从日常生活到专业工作，多场景适用。

混元游戏：首个工业级AIGC游戏内容生产引擎发布

腾讯混元游戏视觉生成平台正式发布。是首个工业级AIGC游戏内容生产引擎，依托混元大模型打造，可大幅提升游戏资产生成与制作效率。

平台面向游戏美术设计师提供AI美术管线、实时画布、AI 2D美术生成、专业角色多视图生成等核心功能，助力设计师快速生成高质量游戏素材与概念草案，将游戏美术设计效率提升数十倍。

美团推出零代码AI应用开发平台 NoCode

美团推出零代码AI应用开发平台NoCode，无需编程经验，通过自然语言描述即可快速生成网站页面、实用工具、小游戏等应用。

平台具备自然语言编程、实时预览、局部修改及一键部署分享等功能，支持版本管理，可实时渲染页面。

Flowith 推出 Agent Neo

Flowith推出Agent Neo，具备无限步骤、无限上下文、无限工具的核心能力，可执行复杂任务、处理海量信息并调用多种大模型与工具。

结合知识库功能，能快速构建数字分身或生成高质量内容。

腾讯 QQ 浏览器推出 QBot AI 浏览器

腾讯正式推出AI浏览器QBot，融合了先进的人工智能技术，为用户提供更智能、便捷的上网体验。

具备智能搜索、内容推荐、语言翻译等多种功能，能根据用户的浏览习惯和偏好提供个性化的服务。

OpenAI 扩展 Responses API：支持MCP、图像生成

OpenAI宣布扩展Responses API，新增对远程连接MCP服务器、图像生成（gpt-image-1模型）、Code Interpreter及文件搜索优化等功能的支持，全面适配GPT-4o系列、GPT-4.1系列及OpenAI o系列推理模型。

开发者可通过几行代码让模型连接Cloudflare等MCP工具，访问用户数据源。

昆仑万维发布天工超级智能体

昆仑万维面向全球发布天工超级智能体（Skywork Super Agents），采用AI agent架构和deep research技术，能生成文档、PPT、表格、网页、播客和音视频等多模态内容。

其deep research能力在GAIA榜单上排名全球第一，超过OpenAI Deep Research和Manus。

万兴科技Filmora升级AI功能

万兴科技旗下视频创意软件Wondershare Filmora作为微软全球开发者大会主论坛合作伙伴亮相。

桌面端升级AI Mate（视频编辑助手）功能、Semantic Search（语义搜索）及knowledge retrieval（知识检索）API，打造基于自然语言搜索与RAG（检索增强生成）的视频剪辑体验，还实现了产品在不同硬件芯片上的AI功能性能提升和AI能力的本地化运行升级。

IBM企业级AI智能体平台watsonx Orchestrate落地

IBM强调AI进入“落地马拉松”，重点支持企业自定义智能体规模化应用，发布watsonx Orchestrate平台，基于开源模型，支持复杂工作流自动化，已与Adobe、AWS、Microsoft等集成。

PPIO推出企业私有化部署解决方案

全球AI基础设施服务商PPIO派欧云正式推出针对大语言模型的企业私有化部署解决方案，通过“专用GPU集群 + 完全托管”模式，为企业构建自主可控的高性能AI部署平台，致力于让企业以更低的成本、更高的效率实现AI应用规模化落地。

其他动态

OpenAI Operator升级为 o3 模型：浏览器交互更稳定、推理更精准，支持填写表单与网页操作任务。

特斯拉展示 Optimus 人形机器人做家务的能力，如扔垃圾、扫地、炒菜等。

北京大学正式上线全球首个覆盖“读文献-做计算-做实验-多学科协同”的AI科研平台——Science Navigator。

京东工业在上海发布行业首个以供应链为核心的工业大模型——Joy industrial。通过“工业大模型＋供应链场景应用”双引擎，构建从底层算力、算法、数据到应用的全栈产品矩阵，助力产业降本、增效、合规、保供。

英伟达CEO黄仁勋在Computex 2025大会上推出下一代Grace Blackwell GB300 AI服务器系统，基于升级版Blackwell芯片，推理性能提升1.5倍，HBM内存增加1.5倍，网络能力翻倍。

火山引擎推出豆包·语音播客模型，具有低成本、高时效、强互动的特点。

英特尔在Computex 2025发布面向专业人士的全新英特尔锐炫™ Pro B系列GPU（B60和B50），基于Xe2架构，专为AI推理和专业工作站设计。同时提供Gaudi 3 AI加速器PCIe卡和机架级系统新部署方案。

GIGABYTE在COMPUTEX 2025展示升级版GIGAPOD GPU集群（支持AMD Instinct MI325X、NVIDIA HGX H200）、全球首秀GIGAPOD直接液冷（DLC）解决方案、符合OCP标准的多种服务器以及面向边缘AI的Jetson Orin嵌入式系统及集成NPU的BRIX迷你PC。

Intel显卡携手蓝戟推出GUNNIR Intel Arc Pro B60 TF 24G专业级显卡，该产品搭载Xe2微架构、24GB大显存，直击AI开发、深度学习、三维影视渲染等高负载场景的算力痛点。

英特尔在GitHub发布AI Assistant Builder公开测试版，这是一个轻量级开放软件框架，用于在英特尔AI PC上本地构建和运行自定义AI代理。

开源项目

Mistral 发布编程专用开源AI 模型 Devstral

Mistral AI与All Hands AI合作推出240亿参数的AI模型Devstral，专为高级软件工程任务设计，处于“研究预览”阶段，以Apache 2.0许可发布，可商用。

Devstral在SWE-Bench Verified基准测试中得分46.8%，超越部分闭源模型。能在单张RTX 4090显卡或32GB RAM的Mac上运行，降低硬件门槛。

微软研究院推出 Magentic-UI，以人为中心的AI智能体研究原型

微软研究院发布Magentic-UI研究原型，是以人为中心的AI智能体，通过网页浏览器实时协助用户完成复杂网络任务。

基于Magentic-One多智能体系统，由AutoGen框架驱动，具备协同规划、协同任务、行为防护和计划学习四大核心功能。

韩国Kakao推出4种开源Kanana语言模型

Kakao在开发者平台 “Hugging Face” 上将其自主开发的人工智能（AI）模型 “Kanana 8B” 和 “Kanana 2.1B” 作为开源发布，共推出四种型号，基于Apache 2.0许可证，任何人都可对其进行自由修改和商用。

相较于今年2月推出的 “Kanana Nano 2.1B” 模型，此次发布的模型性能有明显改进。

西北大学科研团队发布自动识别与量化动物个体行为的开源AI框架

西北大学郭松涛团队基于行为学的分析原理，利用人工智能技术，设计了自动识别与量化动物个体行为的开源AI框架，可广泛应用于圈养动物日常活动规律监测和关键行为异常预警、野生动物行为数据分析研究等领域。

VS Code宣布GitHub Copilot Chat扩展开源

Visual Studio Code官方团队宣布，GitHub Copilot Chat扩展将以MIT协议开源，并将关键AI能力重构入VS Code核心代码，强化社区协作和AI编辑器开发透明度。

Hugging Face开源Open Computer Agent (OCA)

Hugging Face宣布开源Open Computer Agent (OCA)，设计用于虚拟Linux环境自动化任务执行，支持开发者和研究人员定制复杂任务流。

NVIDIA开源物理AI数据集

NVIDIA发布全新技术，其中包括开源物理AI数据集，包含用于开发GR00T N模型的24,000条高质量人形机器人运动轨迹数据。

B站团队开源动漫视频生成模型Index-AniSora

B站团队开源动漫视频生成模型Index-AniSora。模型可一键创建多种动漫风格视频片段，涵盖系列剧集、中国原创动画、漫画改编等。

AniSora拥有超1000万高质量数据，引入时空掩码模块，支持图生视频、帧插值等关键功能。评测数据集包含948段多样化动画视频，人物与运动一致性均达SOTA。

投资融资

Persist AI完成1200万美元A轮融资

Persist AI宣布完成1200万美元A轮融资，旨在通过“云实验室”加速药物配方开发。

清华系具身大脑公司「千诀科技」累计融资数亿规模

清华系具身智能技术公司「千诀科技」完成新一轮Pre-A+轮融资，累计融资数亿元，投资方包括钧山投资、祥峰投资和石溪资本等。本轮融资将用于核心技术演进、产品标准化及产业化交付能力提升。

公司由清华大学自动化系及相关人工智能研究机构的核心成员创立，是国内唯一可对标美国Physical Intelligence公司的企业。

魔法原子再获数亿元融资，将解锁千个落地场景

具身智能机器人公司魔法原子完成新一轮数亿元战略融资，投资方包括禾创致远、芯联资本等产业资本及华映资本等财务投资人。

新资金将用于核心技术研发、VLA模型搭建及加速机器人在工业、商业场景落地。

魔法原子旗下人形机器人“小麦”已进驻工厂产线实训，在商场门店、会展服务、新闻传媒等场景展开实践。

面壁智能获新一轮数亿元融资，引领端侧大模型高效发展与应用普及

面壁智能完成新一轮数亿元融资，由洪泰基金、国中资本、清控金信和茅台基金联合投资。

面壁智能专注于打造高效大模型，端侧全模态模型面壁小钢炮MiniCPM-o 2.6多项能力达国际领先水平，系列模型全平台下载量累计破1000万。

面壁智能发布了业界首个智能座舱纯端侧汽车助手cpmGO，与多家车企合作实现量产车型定点。

美图公司与阿里巴巴达成战略合作并获得 2.5 亿美元投资

美图公司宣布与阿里巴巴达成战略合作并获得2.5亿美元可转债投资。

协议为期3年，年利率1%，阿里巴巴可按每股6.00港元的价格将可转债转换为美图股票。

双方将在电商平台、AI技术、云计算等领域展开合作，阿里巴巴将优先推广美图AI电商工具，协助美图开发电商生图及生视频工具，提升商家营销和运营效率。

尚跃智能完成新一轮战略型股权融资

尚跃智能科技和国智领航（北京）信息科技研究院完成战略股权融资，本轮融资由国智领航（北京）信息科技研究院发起。

战略融资将主要用于推进人工智能通识教育。

光帆科技获得1.3亿人民币天使+融资

北京光帆科技有限公司获得1.3亿人民币天使+融资，参与投资的机构包括Shokz韶音科技、同歌创投等，投后估值5亿人民币。

光帆科技是一家基于硬件产品的AI应用服务商。

谷歌收购AI聊天机器人公司相关情况受美国司法部调查

美国司法部正在调查Alphabet旗下谷歌，审查其与一家热门聊天机器人公司Character.AI的人工智能技术使用协议是否违反了反垄断法。

根据去年与谷歌达成的协议，Character.AI的创始人加入了谷歌，同时谷歌也获得了使用该公司技术的非独占性许可。

OpenAI员工股权捐赠受阻

CNBC在5月23日报道称，因公司股权结构特殊，OpenAI员工难以将所持股权捐赠给慈善机构，引发员工不满。

观点洞察

金融业AI应用与变革流畅性

艾扬斯最近的一项调查发现，报告指出90%欧洲金融服务企业已用AI，但“变革流畅性”而非技术本身是生存关键。需通过共创变革、容忍试错将AI创新转化为增长。

Elon Musk论AI芯片、电力瓶颈与创新

马斯克在CNBC采访中表示，目前AI瓶颈是芯片，很快转向电力，预测2026年中可能电力不足。他认为创新需要质疑权威，是美国优势所在。