
AI科技圈最近一周又发生了啥
QwQ-32B登陆超算互联网平台,MaaS服务再升级
超算互联网平台的MaaS服务迎来了新成员QwQ-32B推理大模型。该模型凭借强化学习技术,在数学推理和代码生成等核心能力上表现出色,已集成至平台的Chatbot可视化对话服务和API在线调用服务。平台新增Chat对话入口,用户可以零门槛体验QwQ-32B的多轮交互和长文本解析能力,满足学术研究、代码生成等场景需求。此外,平台的API接口服务上线仅20余天,调用量已突破百万次,为开发者提供了强大的支持。新用户注册还可享受百万Tokens免费额度,助力快速验证创意与需求
https://mp.weixin.qq.com/s/Eywr-CLETZDj5izuJzt4cA
英伟达发布新一代AI芯片Blackwell Ultra
在英伟达GTC大会上,黄仁勋发布了全新一代AI芯片Blackwell Ultra,其推理性能显著提升,FP4精度下可达到1.1 ExaFLOPS,配备20TB HBM3内存和40TB快速内存。此外,英伟达还推出了两款“真·AI PC”:DGX Station和DGX Spark,分别用于本地运行大模型和桌面优化推理。下一代AI芯片“Vera Rubin”也正式官宣,预计2026年下半年推出,性能将比Hopper提升900倍。同时,英伟达还展示了开源人形机器人功能模型Isaac GR00T N1和量子计算相关布局,进一步巩固其在AI领域的领先地位
https://mp.weixin.qq.com/s/ITMdYNE99Ankv7qnC7rWvA
AlexNet源代码公开:13年后,深度学习里程碑的原始代码发布
谷歌首席科学家Jeff Dean宣布,与计算机历史博物馆合作,公开了AlexNet的原始源代码。AlexNet由Alex Krizhevsky、Ilya Sutskever和Geoffrey Hinton于2012年开发,是深度学习领域的里程碑,其相关论文被引用超过17万次。此次发布的代码包含2012年赢得ImageNet竞赛时的原始版本及训练参数文件,为研究人员和AI爱好者提供了宝贵的学习资源
https://github.com/computerhistory/AlexNet-Source-Code
宇树机器人成为全球首款实现侧空翻的人形机器人
宇树科技的Unitree G1人形机器人成功完成了站立侧空翻动作,成为全球首款实现该动作的人形机器人。Unitree G1身高1.3米,重70斤,拥有23至43个关节电机,关节最大扭矩达120N·m,移动速度可达2米/秒。该机器人采用端到端深度强化学习和仿真训练技术,售价9.9万元起。其还配备3D激光雷达和深度相机,续航时间约2小时。尽管有观点提到波士顿动力曾展示过类似动作,但Unitree G1的平地起跳更具挑战性,且其开源数据采集方法和学习算法等,旨在推动具身人工智能产业发展
https://www.qbitai.com/2025/03/265720.html
OpenAI推出最昂贵API o1-pro,价格千倍于DeepSeek
OpenAI在其开发者API中推出了o1推理模型的更强大版本o1-pro。该版本使用更多计算资源以提供更好的响应,仅对特定开发者开放,支持视觉、函数调用等功能。其定价极高,每百万输入token收费150美元,每百万输出token收费600美元,远高于自家其他模型。相比之下,DeepSeek-R1的定价则显得亲民许多,甚至推出了错峰优惠时段
https://mp.weixin.qq.com/s/gIeKKMO9oBl55HiBBKc3hQ
百度发布文心大模型4.5及X1,两款模型免费开放
百度正式发布文心大模型4.5和文心大模型X1,两款模型已在文心一言官网免费开放,用户可直接体验。文心大模型4.5是新一代原生多模态基础大模型,具备优秀的多模态理解能力和显著提升的语言能力,其关键技术包括动态注意力掩码、多模态异构专家扩展等。文心大模型X1则是首个自主运用工具的深度思考模型,支持多模态,具备更强的理解、规划、反思和进化能力,适用于中文知识问答、文学创作等多种场景。此外,文心大模型4.5已上线百度智能云千帆大模型平台,企业用户和开发者可调用API,输入价格低至0.004元/千tokens,输出价格低至0.016元/千tokens
https://mp.weixin.qq.com/s/mwuO5c6vAcfQE3g_DkB4uw
阶跃星辰开源图生视频模型Step-Video-TI2V,支持运动可控与动漫效果
上海阶跃星辰智能科技有限公司开源了图生视频模型Step-Video-TI2V,该模型基于30B参数训练,支持生成102帧、5秒、540P分辨率的视频。其两大核心特点为运动幅度可控和镜头运动可控,能够平衡视频的动态性和稳定性,尤其在动漫类任务上表现出色。此外,该模型已完成与华为昇腾计算平台的适配,并在魔乐社区上线,用户可通过阶跃AI网页版或App体验
https://mp.weixin.qq.com/s/p2O1rMp9suVHKfxOUG9RiA
Mistral开源多模态小模型,单个RTX 4090即可运行
法国AI创企Mistral AI开源了一个24B的多模态小模型Mistral Small 3.1,其性能在多个基准上超越了Gemma 3和GPT-4o Mini,推理速度达到150个token/秒。该模型仅需一个RTX 4090或32GB RAM的Mac即可运行,且采用Apache 2.0开源协议,适用于研究和商业用途。与前代相比,它拥有更大的上下文窗口(128k),新增了视觉能力,能够处理指令遵循、对话辅助、图像理解等多种生成式AI任务。目前,该模型已在Hugging Face网站发布,开发者可下载使用
https://mistral.ai/news/mistral-small-3-1
Gemini推出协作新功能:Canvas和Audio Overview
Gemini推出两项新功能,Canvas和Audio Overview。Canvas是一个互动空间,用户可以在其中实时编写和编辑文档或代码,并通过Gemini的反馈进行优化。此外,Canvas还支持将内容导出到Google Docs,方便团队协作。Audio Overview则将文档、幻灯片等转化为类似播客的音频讨论,通过AI主持人的对话形式,帮助用户快速理解复杂信息。这些功能现已向Gemini和Gemini Advanced订阅用户开放
https://blog.google/products/gemini/gemini-collaboration-features/
昆仑万维开源R1V视觉思维链推理模型,开启多模态思考新时代
昆仑万维正式开源首款工业界多模态思维链推理模型Skywork R1V,成为国内首个开源多模态推理模型的企业。该模型具备强大的视觉理解和推理能力,在MATH500基准测试中取得94.0分、AIME测试中取得72.0分的优异成绩,显著领先于行业内主流模型。其通过文本推理能力的高效迁移、多模态混合式训练和自适应长度思维链蒸馏等技术创新,实现了视觉与文本能力的深度融合
https://github.com/SkyworkAI/Skywork-R1V