1️⃣刚刚,商汤发布第六代大模型:6000亿参数多模态MoE,中长视频直接可推理
量子位|阅读原文
现在的国产AI应用,一口气看好几分钟的视频,都可以直接做推理和解析了!只需“喂”上一段柯南片段,AI就摇身一变成“名侦探”做剖析,它会对整个视频的内容先做一个总结,再按照秒级,对视频片段做内容上的推演。
在视频总结和视频要点之后,我们继续提出要求:请帮我剪辑视频中的片段,包含任意由客户指定的场景,提取相关片段,标明时间范围,并为每个片段配上解说文案,用户场景为:进球时刻。它就会立即执行深度思考,自动剪辑出一段8秒的高光片段,并附上建议搭配的音乐或音效。
这便是商汤最新升级的日日新SenseNova V6解锁的新能力——原生多模态通用大模型,采用6000亿参数MoE架构,实现文本、图像和视频的原生融合。
从性能评测来看,SenseNova V6已经在纯文本任务和多模态任务中,多项指标均已超越GPT-4.5、Gemini 2.0 Pro,并全面超越DeepSeek V3。在强推理能力上,日日新V6/V6 Reasoner的多模态和语言深度推理任务上同时超过了OpenAI的o1和Gemini 2.0 flash-thinking的水平。同时在小版本的模型上,SenseNova V6的各项成绩也超越GPT-4o。纵观整体,可以将商汤此次发布新模型的特点总结为三个关键词——强推理、强交互和长记忆。
2️⃣MoE模型已成新风口,AI基础设施竞速升级
机器之心|阅读原文
因为基准测试成绩与实际表现相差较大,近期开源的 Llama 4 系列模型正陷入争议的漩涡之中,但有一点却毫无疑问:MoE(混合专家)定然是未来 AI 大模型的主流范式之一。
在 AI 势能大会下午的 AI 基础设施峰会上,阿里云智能集团副总裁、阿里云智能计算平台事业部负责人汪军华就谈到了 MoE 架构特有的一些困难,包括 token drop 选择对吞吐的影响、在路由专家与共享专家之间考虑效率和效果的权衡、专家的选取数量和比例等。
阿里云已经在解决这些难题上取得了重大进展。峰会上,针对 MoE 架构的模型,阿里云宣布基于 PAI-DLC 云原生分布式深度学习训练平台推出了 FlashMoE,这是一款支持超大规模 MoE 混合精度训练的高性能训练框架,具有多种强大特性,包括支持多种 token 路由策略、支持上下文并行与张量并行解耦等。
当然,阿里云在 AI 基础设施上的布局远不限于 MoE。无论是硬件算力的投入,还是一体化的训练和推理服务,它都在用硬核实力夯实自己的领先地位。在这场 AI 基础设施的竞赛中,阿里云已然抢占先机。
3️⃣AI医学影像通用大模型硬核突围!重压之下打破进口垄断,引领国产替代
新智元|阅读原文
当下,中国医疗行业正迎来一场硬核突围的历史性转折。面对供应链断裂、技术垄断多重封锁,国产医疗三剑客以技术为剑,以创新为盾,强势打破技术护城河。这将是一场从「跟跑」到「领跑」的逆袭之战。
联影:硬核技术突破。他们自2018年起就开始深耕医疗AI,打造了医疗大模型及多款智能体,如电子病历智能体和门诊客服智能体。这些智能体已在复旦大学附属中山医院等顶尖机构落地应用,显著提升了医院效率和患者体验。此外,联影通过推出全球领先的设备,如5.0T磁共振uMR Jupiter和AI赋能的uCT Atlas Pro,进一步巩固了技术优势。在海外布局方面,联影与麻省总医院等国际顶尖机构合作,成功将uMI Panorama GS等设备引入全球市场。
迈瑞医疗以「设备+IT+AI」为核心战略,通过数智化转型和国际化布局应对现在的不确定性。国产替代方面,迈瑞持续优化体外诊断和医学影像产品。例如MT 8000S智能样本处理系统和H-120糖化血红蛋白分析仪,通过高效自动化和精准检测技术满足国内临床需求,减少对进口设备的依赖。同时,迈瑞通过收购海肽生物和德国德赛,构建了从原材料到试剂的自主生产体系,提升了供应链安全性和成本控制能力。
对此,你怎么看?
支付宝/钉钉扫码加入支付宝开发者钉组织,可了解支付宝开放能力最新动态,订阅文档更新消息,和同城同行业交流业务,与支付宝产研沟通交流。