2025年5月24日AI新闻汇总
模型发布与升级
- 开源编程模型Devstral带来新选择:Mistral AI与All Hands AI合作推出240亿参数的开源AI模型Devstral,专为高级软件工程任务设计。它在SWE - Bench Verified基准测试中得分46.8%,超越部分闭源模型,为开发者提供更多选择,促进编程技术共享和创新,但也面临代码安全性和知识产权保护等问题。
- 昆仑万维发布天工超级智能体:被称为基于deep research的 “AI版office”,采用AI agent架构和deep research技术,能生成文档、PPT、表格、网页、播客和音视频等多模态内容,其deep research能力在GAIA榜单上排名全球第一,超过OpenAI Deep Research和其他竞争对手,将冲击传统办公软件市场,改变人们办公方式。
- 通义千问模型更新:阿里云通义千问VL - Max模型优化数学推理与回复风格,格式清晰度提升,已开放抢先体验。
企业战略与布局
- OpenAI的多项举措:
- 宣布 “星际之门阿联酋” 项目,是人工智能基础设施平台Stargate的首个国际部署,汇聚G42、甲骨文、英伟达、软银和思科等行业巨头,开启全球扩张战略,但面临不同地区政策、文化和市场差异的挑战。
- 以约65亿美元收购由CEO Sam Altman与前苹果首席设计官Jony Ive联合创办的AI设备初创公司io,获得约55名顶尖硬件工程师、软件开发者和制造专家,包括多位曾参与iPhone设计的前苹果设计师,有望打造更具竞争力的AI设备,但收购后的整合工作是巨大挑战。
- 扩展Responses API,新增对远程连接MCP服务器、图像生成、Code Interpreter及文件搜索优化等功能的支持,增强模型功能和适用性,但数据安全和隐私保护问题更突出。
- 京东工业发布工业大模型:发布行业首个以供应链为核心的工业大模型Joy industrial,依托京东工业在工业数智供应链领域的经验积累和数据沉淀,构建全栈产品矩阵,首批推出需求代理、运营代理、关务代理、商品专家、集成专家等AI产品,助力产业降本增效,推动工业领域数字化转型。
- 荣耀转型AI终端生态公司:在2025全球人工智能终端展上首次解读“阿尔法战略”,宣布投资100亿美元从智能手机制造商转型为AI终端生态公司。提出“1 + 3 + N”创新模式,计划2025年接入100 + 硬件品类,2027年达1000 + 。智能体技术聚焦多模态感知等四大领域,预计年底YOYO智能体用户超800万,推动终端从工具向数字伙伴转变。
- 甲骨文400亿美元豪购英伟达芯片:斥资400亿美元采购英伟达最新GB200芯片,部署于得州阿比林数据中心,该数据中心装机容量达1.2吉瓦,预计2026年全面投运,将成为全球首个“Zetta级”(10^21次运算/秒)算力集群。这是其“以算力换市场”的激进策略,有望从“数据库供应商”转型为“AI基础设施服务商”,但面临供应链风险和政策变数等挑战。
产品功能更新
- 豆包App新增视频问答功能:字节跳动豆包App新增视频问答功能,支持多模态交互,用户可实时互动并联网搜索最新信息,进一步拓展多模态交互场景。
- 腾讯元宝功能升级:接入DeepSeek模型,支持双模引擎(混元 + DeepSeek)文生图创作,并推出视频问答功能,强化多模态处理能力,与QQ浏览器深度整合。
- 百度文小言多模型调度升级:支持自动调用文心X1、DeepSeek等多模型,新增端到端语音大模型与图片问答功能,方言识别能力覆盖重庆、广东等地。
- 微软Win11截图工具将新增功能:截图工具将新增录屏保存为GIF功能,支持MP4/GIF双格式输出,用户可自定义GIF质量并通过Ctrl + G快捷切换,但微软尚未正式公布该更新细节。
- 微软为记事本新增AI写作功能:在Windows 11预览版中为记事本新增AI写作功能,用户可通过AI生成文本内容并调整文字长度、语气风格和格式。同时测试“必应视频创建器”新工具,基于OpenAI的Sora模型生成视频,目前处于Beta测试阶段,未来将扩展到Bing移动端和桌面端。
行业应用进展
- 特斯拉Optimus展示做家务能力:展示了Optimus人形机器人的做家务能力,如扔垃圾、扫地、炒菜,还成功搬运了Model X零件。埃隆・马斯克重申Optimus将成为特斯拉的重要产品,未来有望进入家庭和工业领域,但要实现大规模商业化应用,还需解决成本降低、安全性和可靠性提升等问题。
- QQ浏览器推出“AI高考通”:推出国内首个高考AI助手“高考通”,基于2800 + 院校和1600 + 专业数据库,通过大模型技术实现智能志愿填报,支持个性化方案生成与调整,具备深度思考、联网搜索和多轮对话功能,为考生提供精准高效的志愿填报辅助服务。
- 阿里邮箱适配鸿蒙折叠屏电脑:率先适配华为鸿蒙折叠屏电脑HUAWEI MateBook Fold,成为首批150 + 专属应用之一。通过200项API对接实现完美适配,既展现技术实力,也为商务用户提供创新的跨设备办公体验。
- AI技术融入文化创意产业:在深圳国际会展中心10号馆展厅现场,AI技术让传统艺术创作突破人力限制,如音乐机器人依托AI技术可达到人类演奏钢琴6级水准,用于商业表演等场景;工业机械臂能挥毫泼墨,还能实现高精度焊接与打磨。
违规与监管事件
- Kimi chat被通报违规:月之暗面旗下Kimi chat因违规收集个人信息被国家网信办通报,月活用户腰斩至1820万,排名跌至第四位,面临整改压力。
- 智谱清言因隐私问题被点名:因超出授权范围收集个人信息被通报,用户隐私争议加剧,月活排名持续下滑。
- 南京警方查处AI伪造谣言案:网民张某燕利用AI图像生成工具伪造“外籍留学生强闯南京火车站安检”场景并配文发布,蓄意编造涉外籍人员的冲突场景,误导网民,对社会秩序和城市形象造成不良影响。张某燕被依法作出行政拘留5日的处罚决定,凸显了新技术应用与网络安全监管的博弈。
科技竞赛与合作
- 量子 + AI成破局关键:人工智能算力需求增长远超摩尔定律极限,量子计算凭借指数级算力跃升成为AI突破瓶颈的希望。谷歌Willow芯片实现105量子比特,5分钟完成经典超算需10^25年的任务,错误率降低至可纠错阈值;微软Majorana1基于拓扑超导体的新型量子芯片,仅手掌大小即可容纳百万量子比特;中国“祖冲之四号”超导量子比特数突破504,量子云平台“天衍”接入国家超算互联网。量子与AI融合在金融、医药、智能制造等领域率先爆发应用,但也面临安全危机、伦理争议和技术瓶颈等挑战。
- Google I/O 2025开发者大会宣布多项进展:Gemini 2.5 Pro模型在LMArena排行榜首位,性能卓越;推出Google Beam视频通信平台,提供沉浸式3D体验;Gemini Live整合了Project Astra功能,Agent Mode助力任务执行;个性化智能回复和AI Mode重塑搜索体验等功能也将陆续推出,展示了谷歌在AI领域的强大实力和持续创新能力。