大家好,这里是K姐。
一个帮助你把AI真正用起来的女子。
本篇内容,带你快速了解本周AI热点资讯。
AI大事件
Google I/O 2025 开发者大会,从研究到现实,AI技术全面升级
Google I/O 2025 大会宣布多项进展。
-
Gemini 2.5 Pro模型在LMArena排行榜首位,性能卓越。
-
推出Google Beam视频通信平台,提供沉浸式3D体验。
-
Gemini Live整合Project Astra功能,Agent Mode助力任务执行。
-
个性化智能回复将推出,AI Mode重塑搜索体验。
-
全新Imagen 4生成细节超逼真。
-
Veo 3首次实现音视频融合。凭借其逼真的场景、可控的角色一致性、声音合成及多样的编辑功能,在AI视频生成领域树立了新的标杆。
Anthropic发布史上最强AI模型Claude 4
Anthropic发布Claude 4模型 (包括Claude Opus 4和Claude Sonnet 4)。
该模型被誉为“史上最强AI模型”及“世界最佳编程模型”,具备分析数千数据源、长时间执行任务、编写接近人类水平内容和复杂操作的能力。
它采用了全新的混合推理架构,能在SWE-Bench Verified测试中取得72.5%成绩,Terminal-bench测试中取得43.2%成绩,并具备长达7小时的持续工作能力。
OpenAI最大收购,65亿美元拿下苹果前高管Jony Ive公司io
OpenAI宣布以约65亿美元收购由CEO Sam Altman与前苹果首席设计官Jony Ive联合创办的AI设备初创公司io。
这笔收购将是OpenAI史上最大一笔交易,预计夏季完成,需监管部门批准。
收购后,OpenAI将获得约55名顶尖硬件工程师、软件开发者和制造专家,包括多位曾参与iPhone设计的前苹果设计师。
微软Build 2025大会:拥抱MCP协议,引入xAI大模型
微软在Build 2025大会上宣布全面支持模型上下文协议(MCP),并与GitHub共同加入MCP指导委员会,推动开放标准落地。其智能体方案已覆盖超过23万家机构。
同时,微软公司宣布把埃隆·马斯克的xAI公司的Grok 3和Grok 3 mini人工智能模型引入Azure AI Foundry平台,作为微软在公司云平台内直接托管和收费的新产品。
OpenAI等科技巨头将在阿联酋建设人工智能基础设施集群
OpenAI、英伟达等科技巨头将携手合作,在阿拉伯联合酋长国建设一座名为“星际之门阿联酋”(Stargate UAE)的人工智能基础设施集群。
这一项目是OpenAI、软银和甲骨文今年1月宣布在美国建设人工智能基础设施计划的姊妹项目,预计第一阶段的200兆瓦人工智能“集群”将于2026年投入使用。
新产品发布
豆包上线视频通话功能:支持实时视频问答互动
豆包App实时通话功能升级,支持视频聊天问答。
本次升级基于视觉推理模型,支持联网搜索,工作、生活和学习遇到问题,随时和豆包视频对话。
该功能具有实时场景理解能力,通过摄像头捕捉用户周围环境,结合问题进行智能分析。从日常生活到专业工作,多场景适用。
混元游戏:首个工业级AIGC游戏内容生产引擎发布
腾讯混元游戏视觉生成平台正式发布。是首个工业级AIGC游戏内容生产引擎,依托混元大模型打造,可大幅提升游戏资产生成与制作效率。
平台面向游戏美术设计师提供AI美术管线、实时画布、AI 2D美术生成、专业角色多视图生成等核心功能,助力设计师快速生成高质量游戏素材与概念草案,将游戏美术设计效率提升数十倍。
美团推出零代码AI应用开发平台 NoCode
美团推出零代码AI应用开发平台NoCode,无需编程经验,通过自然语言描述即可快速生成网站页面、实用工具、小游戏等应用。
平台具备自然语言编程、实时预览、局部修改及一键部署分享等功能,支持版本管理,可实时渲染页面。
Flowith 推出 Agent Neo
Flowith推出Agent Neo,具备无限步骤、无限上下文、无限工具的核心能力,可执行复杂任务、处理海量信息并调用多种大模型与工具。
结合知识库功能,能快速构建数字分身或生成高质量内容。
腾讯 QQ 浏览器推出 QBot AI 浏览器
腾讯正式推出AI浏览器QBot,融合了先进的人工智能技术,为用户提供更智能、便捷的上网体验。
具备智能搜索、内容推荐、语言翻译等多种功能,能根据用户的浏览习惯和偏好提供个性化的服务。
OpenAI 扩展 Responses API:支持MCP、图像生成
OpenAI宣布扩展Responses API,新增对远程连接MCP服务器、图像生成(gpt-image-1模型)、Code Interpreter及文件搜索优化等功能的支持,全面适配GPT-4o系列、GPT-4.1系列及OpenAI o系列推理模型。
开发者可通过几行代码让模型连接Cloudflare等MCP工具,访问用户数据源。
昆仑万维发布天工超级智能体
昆仑万维面向全球发布天工超级智能体(Skywork Super Agents),采用AI agent架构和deep research技术,能生成文档、PPT、表格、网页、播客和音视频等多模态内容。
其deep research能力在GAIA榜单上排名全球第一,超过OpenAI Deep Research和Manus。
万兴科技Filmora升级AI功能
万兴科技旗下视频创意软件Wondershare Filmora作为微软全球开发者大会主论坛合作伙伴亮相。
桌面端升级AI Mate(视频编辑助手)功能、Semantic Search(语义搜索)及knowledge retrieval(知识检索)API,打造基于自然语言搜索与RAG(检索增强生成)的视频剪辑体验,还实现了产品在不同硬件芯片上的AI功能性能提升和AI能力的本地化运行升级。
IBM企业级AI智能体平台watsonx Orchestrate落地
IBM强调AI进入“落地马拉松”,重点支持企业自定义智能体规模化应用,发布watsonx Orchestrate平台,基于开源模型,支持复杂工作流自动化,已与Adobe、AWS、Microsoft等集成。
PPIO推出企业私有化部署解决方案
全球AI基础设施服务商PPIO派欧云正式推出针对大语言模型的企业私有化部署解决方案,通过“专用GPU集群 + 完全托管”模式,为企业构建自主可控的高性能AI部署平台,致力于让企业以更低的成本、更高的效率实现AI应用规模化落地。
其他动态
OpenAI Operator升级为 o3 模型 :浏览器交互更稳定、推理更精准,支持填写表单与网页操作任务。
特斯拉展示 Optimus 人形机器人做家务的能力,如扔垃圾、扫地、炒菜等。
北京大学正式上线全球首个覆盖“读文献-做计算-做实验-多学科协同”的AI科研平台——Science Navigator。
京东工业在上海发布行业首个以供应链为核心的工业大模型——Joy industrial。通过“工业大模型+供应链场景应用”双引擎,构建从底层算力、算法、数据到应用的全栈产品矩阵,助力产业降本、增效、合规、保供。
英伟达CEO黄仁勋在Computex 2025大会上推出下一代Grace Blackwell GB300 AI服务器系统,基于升级版Blackwell芯片,推理性能提升1.5倍,HBM内存增加1.5倍,网络能力翻倍。
火山引擎推出豆包·语音播客模型,具有低成本、高时效、强互动的特点。
英特尔在Computex 2025发布面向专业人士的全新英特尔锐炫™ Pro B系列GPU(B60和B50),基于Xe2架构,专为AI推理和专业工作站设计。同时提供Gaudi 3 AI加速器PCIe卡和机架级系统新部署方案。
GIGABYTE在COMPUTEX 2025展示升级版GIGAPOD GPU集群(支持AMD Instinct MI325X、NVIDIA HGX H200)、全球首秀GIGAPOD直接液冷(DLC)解决方案、符合OCP标准的多种服务器以及面向边缘AI的Jetson Orin嵌入式系统及集成NPU的BRIX迷你PC。
Intel显卡携手蓝戟推出GUNNIR Intel Arc Pro B60 TF 24G专业级显卡,该产品搭载Xe2微架构、24GB大显存,直击AI开发、深度学习、三维影视渲染等高负载场景的算力痛点。
英特尔在GitHub发布AI Assistant Builder公开测试版,这是一个轻量级开放软件框架,用于在英特尔AI PC上本地构建和运行自定义AI代理。
开源项目
Mistral 发布编程专用 开源AI 模型 Devstral
Mistral AI与All Hands AI合作推出240亿参数的AI模型Devstral,专为高级软件工程任务设计,处于“研究预览”阶段,以Apache 2.0许可发布,可商用。
Devstral在SWE-Bench Verified基准测试中得分46.8%,超越部分闭源模型。能在单张RTX 4090显卡或32GB RAM的Mac上运行,降低硬件门槛。
微软研究院推出 Magentic-UI,以人为中心的AI智能体研究原型
微软研究院发布Magentic-UI研究原型,是以人为中心的AI智能体,通过网页浏览器实时协助用户完成复杂网络任务。
基于Magentic-One多智能体系统,由AutoGen框架驱动,具备协同规划、协同任务、行为防护和计划学习四大核心功能。
韩国Kakao推出4种开源Kanana语言模型
Kakao在开发者平台 “Hugging Face” 上将其自主开发的人工智能(AI)模型 “Kanana 8B” 和 “Kanana 2.1B” 作为开源发布,共推出四种型号,基于Apache 2.0许可证,任何人都可对其进行自由修改和商用。
相较于今年2月推出的 “Kanana Nano 2.1B” 模型,此次发布的模型性能有明显改进。
西北大学科研团队发布自动识别与量化动物个体行为的开源AI框架
西北大学郭松涛团队基于行为学的分析原理,利用人工智能技术,设计了自动识别与量化动物个体行为的开源AI框架,可广泛应用于圈养动物日常活动规律监测和关键行为异常预警、野生动物行为数据分析研究等领域。
VS Code宣布GitHub Copilot Chat扩展开源
Visual Studio Code官方团队宣布,GitHub Copilot Chat扩展将以MIT协议开源,并将关键AI能力重构入VS Code核心代码,强化社区协作和AI编辑器开发透明度。
Hugging Face开源Open Computer Agent (OCA)
Hugging Face宣布开源Open Computer Agent (OCA),设计用于虚拟Linux环境自动化任务执行,支持开发者和研究人员定制复杂任务流。
NVIDIA开源物理AI数据集
NVIDIA发布全新技术,其中包括开源物理AI数据集,包含用于开发GR00T N模型的24,000条高质量人形机器人运动轨迹数据。
B站团队开源动漫视频生成模型Index-AniSora
B站团队开源动漫视频生成模型Index-AniSora。模型可一键创建多种动漫风格视频片段,涵盖系列剧集、中国原创动画、漫画改编等。
AniSora拥有超1000万高质量数据,引入时空掩码模块,支持图生视频、帧插值等关键功能。评测数据集包含948段多样化动画视频,人物与运动一致性均达SOTA。
投资融资
Persist AI完成1200万美元A轮融资
Persist AI宣布完成1200万美元A轮融资,旨在通过“云实验室”加速药物配方开发。
清华系具身大脑公司「千诀科技」累计融资数亿规模
清华系具身智能技术公司「千诀科技」完成新一轮Pre-A+轮融资,累计融资数亿元,投资方包括钧山投资、祥峰投资和石溪资本等。本轮融资将用于核心技术演进、产品标准化及产业化交付能力提升。
公司由清华大学自动化系及相关人工智能研究机构的核心成员创立,是国内唯一可对标美国Physical Intelligence公司的企业。
魔法原子再获数亿元融资,将解锁千个落地场景
具身智能机器人公司魔法原子完成新一轮数亿元战略融资,投资方包括禾创致远、芯联资本等产业资本及华映资本等财务投资人。
新资金将用于核心技术研发、VLA模型搭建及加速机器人在工业、商业场景落地。
魔法原子旗下人形机器人“小麦”已进驻工厂产线实训,在商场门店、会展服务、新闻传媒等场景展开实践。
面壁智能获新一轮数亿元融资,引领端侧大模型高效发展与应用普及
面壁智能完成新一轮数亿元融资,由洪泰基金、国中资本、清控金信和茅台基金联合投资。
面壁智能专注于打造高效大模型,端侧全模态模型面壁小钢炮MiniCPM-o 2.6多项能力达国际领先水平,系列模型全平台下载量累计破1000万。
面壁智能发布了业界首个智能座舱纯端侧汽车助手cpmGO,与多家车企合作实现量产车型定点。
美图公司与阿里巴巴达成战略合作并获得 2.5 亿美元投资
美图公司宣布与阿里巴巴达成战略合作并获得2.5亿美元可转债投资。
协议为期3年,年利率1%,阿里巴巴可按每股6.00港元的价格将可转债转换为美图股票。
双方将在电商平台、AI技术、云计算等领域展开合作,阿里巴巴将优先推广美图AI电商工具,协助美图开发电商生图及生视频工具,提升商家营销和运营效率。
尚跃智能完成新一轮战略型股权融资
尚跃智能科技和国智领航(北京)信息科技研究院完成战略股权融资,本轮融资由国智领航(北京)信息科技研究院发起。
战略融资将主要用于推进人工智能通识教育。
光帆科技获得1.3亿人民币天使+融资
北京光帆科技有限公司获得1.3亿人民币天使+融资,参与投资的机构包括Shokz韶音科技、同歌创投等,投后估值5亿人民币。
光帆科技是一家基于硬件产品的AI应用服务商。
谷歌收购AI聊天机器人公司相关情况受美国司法部调查
美国司法部正在调查Alphabet旗下谷歌,审查其与一家热门聊天机器人公司Character.AI的人工智能技术使用协议是否违反了反垄断法。
根据去年与谷歌达成的协议,Character.AI的创始人加入了谷歌,同时谷歌也获得了使用该公司技术的非独占性许可。
OpenAI员工股权捐赠受阻
CNBC在5月23日报道称,因公司股权结构特殊,OpenAI员工难以将所持股权捐赠给慈善机构,引发员工不满。
观点洞察
金融业AI应用与变革流畅性
艾扬斯最近的一项调查发现,报告指出90%欧洲金融服务企业已用AI,但“变革流畅性”而非技术本身是生存关键。需通过共创变革、容忍试错将AI创新转化为增长。
Elon Musk论AI芯片、电力瓶颈与创新
马斯克在CNBC采访中表示,目前AI瓶颈是芯片,很快转向电力,预测2026年中可能电力不足。他认为创新需要质疑权威,是美国优势所在。