- 博客(26)
- 收藏
- 关注
转载 把模型跑通,也把问题跑出来——开源GPU创新生态赛S1赛道二实践总结
随着大模型与算力需求的持续增长,GPU已不仅是AI竞争的核心硬件,更成为AI开源软件生态与开源创新的重要承载平台。第八届CCF开源创新大赛,“开源 GPU创新生态赛(常规赛)S1” 聚焦 国产GPU技术与开源AI生态的深度融合,其中赛道二:GPU开源生态挑战赛,围绕软件栈适配、AI 框架移植与推理引擎优化等方向展开,吸引了来自高校、科研机构和产业界的广泛参与。
2026-01-08 14:55:47
51
原创 沐曦股份曦云C系列GPU Day 0 适配通义千问Qwen3.5-122B-A10B等三款新模型
通义千问团队正式开源发布Qwen3.5系列中等规模模型,推出包括Qwen3.5-35B-A3B、Qwen3.5-122B-A10B、Qwen3.5-27B三个版本。沐曦股份旗下曦云C系列GPU已同步完成对上述模型的Day 0 适配工作,为用户提供即时可用的高性能AI算力支持。
2026-02-26 14:14:22
726
原创 vLLM Meetup上海站圆满落幕
vLLM Meetup上海站成功举办。活动汇聚技术专家、社区开发者及行业用户,围绕vLLM(一种用于大型语言模型的高性能推理引擎)的技术进展、生态建设及应用展开深度探讨。会议涵盖社区贡献指南、分布式推理架构、多模态模型集成等前沿议题,现场互动热烈,并提出每年举办vLLM Con大会的倡议,为AI推理领域的技术落地注入新动能。
2026-02-24 17:13:54
608
原创 基于内生复杂性的类脑脉冲大模型“瞬悉1.0”问世
中国科学院自动化研究所李国齐、徐波团队在发表原创内生复杂性理论系列论文的工作基础上,与沐曦MetaX合作,打造了类脑脉冲大模型“瞬悉1.0”(SpikingBrain-1.0),在国产千卡GPU算力平台上完成全流程训练和推理,实现了大模型在超长序列推理上数量级的效率和速度提升,展示了构建国产自主可控的新型非Transformer大模型架构生态的可行性。
2026-02-19 20:26:25
650
原创 【智算芯闻】具身智能的新范式:利用AI智能体加速机器人学习技能
你有没有想过,AI 不再只是待在屏幕里回答问题、写代码,而是真真正正地走进现实世界,像人一样感知、决策、行动?
2026-02-17 22:52:29
846
原创 【智算芯闻】沐曦MXMACA软件平台:让大模型训练更简单、更高效
为了让大模型的训练过程更顺畅、更高效,沐曦MXMACA软件平台(简称 MXMACA)具有无缝兼容CUDA的能力,科学兼容Megatron-LM的绝大多数特性。此外,MXMACA进行多方面的优化,帮助科研人员和工程师能够快速在沐曦硬件环境中完成各类前沿模型的训练。下面,我们将从几个关键角度介绍MXMACA在大模型训练方面的改进思路和优化效果,让更多的读者轻松了解“大模型训练背后的那些事”。
2026-02-14 20:02:20
758
原创 曦云C系列GPU Day 0 适配智谱全新一代大模型GLM-5
今日,智谱AI正式上线并开源全新一代大模型 GLM-5,沐曦股份实现 Day 0 深度适配。 GLM-5目前可于曦云 C 系列(C500/C550/C588)上稳定高效运行。
2026-02-12 09:44:17
861
原创 强化学习进入“千卡级”时代,沐曦助力 siiRL 2.0 全面升级
在人工智能加速迈向大模型与智能体时代的今天,强化学习(Reinforcement Learning,RL)已经成为推动智能系统演化的关键技术。随着强化学习训练规模不断扩大,对底层算力提出了前所未有的挑战。近日,上海创智学院 AI Infra 团队发布的 siiRL 2.0,以其卓越特性为强化学习的发展带来了新的突破,沐曦则凭借自身优势为 siiRL 2.0 的升级提供了坚实支撑,共同推动强化学习正式迈入 “千卡级”时代。
2026-02-10 10:11:35
310
原创 实践AI+科学计算!沐曦全面支持PaddleScience
当前,沐曦已通过Custom Device方案完成对PaddlePaddle 3.X新版本的适配工作,并且与百度飞桨PaddleScience实现了全面深度适配。为了让广大开发者能够零门槛体验这一强大组合,沐曦已准备了详细的入门教程,助您快速上手AI驱动的科学计算。
2026-02-09 14:50:40
627
原创 国产GPGPU × 国产软件|沐曦携手 ABACUS,共筑国产科学计算新生态
原子算筹(ABACUS)发布了最新迭代版v3.9.0.14和v3.9.0.15。值得关注的是,在这些更新中,沐曦科学计算团队首次以开发者身份正式加入 ABACUS 社区。
2026-02-06 16:55:51
919
原创 沐曦曦索 × AI4S:材料研发新范式
2026年1月29日,“AI4Science 前沿:材料研发计算新范式——国产算力×深度学习框架技术沙龙·上海站”在张江百度飞桨人工智能产业赋能中心举办。本次活动由百度飞桨与沐曦联合主办,聚焦 AI for Science(AI4S)在材料科学领域的最新应用。来自高校、科研院所及企业的数十位开发者与技术专家齐聚一堂,共同探讨国产算力与深度学习框架如何协同推动材料研发的创新。
2026-02-05 16:47:16
962
原创 曦云C500/C550 Day 0 适配智谱GLM-OCR
今天,智谱AI正式发布并开源GLM-OCR,以 “小尺寸、高精度” 实现文档解析能力新标杆。沐曦股份曦云C500/C550 GPU充分发挥高生态兼容性、软硬协同能力优势,高效完成与智谱GLM-OCR Day 0适配。
2026-02-03 16:14:14
722
原创 曦云C600 Day 0 适配阶跃星辰基座模型 Step 3.5 Flash
今天,阶跃星辰技术团队发布并开源最新旗舰基座模型 Step 3.5 Flash。沐曦股份已实现曦云C600与该模型深度协同适配,为国内首先完成与该模型Day 0适配的国产算力。
2026-02-02 15:19:27
542
原创 曦云C500/C550 24小时内完成腾讯混元图像3.0图生图模型适配
近日,腾讯混元团队宣布开源混元图像3.0图生图版本(HunyuanImage 3.0-Instruct),沐曦股份曦云C500/C550 24小时内完成适配,为国内首批适配该模型的国产算力。
2026-02-02 14:51:15
638
原创 曦云C500/C550 Day 0 适配PaddleOCR-VL-1.5
PaddleOCR-VL 系列的全新迭代版本PaddleOCR-VL-1.5今天正式上线,沐曦曦云C500/C550 Day 0 适配PaddleOCR-VL-1.5模型,助力PaddleOCR-VL-1.5第一时间面向企业与开发者提供模型服务。
2026-02-02 14:25:44
587
原创 曦索X全新系列产品发布 为科学智能而生
1月27日,沐曦股份(股票代码:688802.SH)正式推出曦索X系列全新GPU品牌与产品线。该系列产品是面向科学智能场景深度优化的高性能计算芯片,旨在以强大计算能力赋能前沿科研领域,推动传统科学计算与人工智能驱动的科研新范式融合发展。
2026-01-28 17:09:45
379
原创 「开源筑基·数实维新」沐曦让开发更简单,让创新更专注
2025年,沐曦以自研MXMACA软件栈为核心,系统推进国产GPU的开源软件体系与生态建设,持续降低国产算力使用门槛,促进大模型与行业应用的规模化落地,在基础软件、开源协作、行业应用和开发者生态等方面形成了一批可量化、可验证的阶段性成果。我们坚持让开发更简单,让创新更专注。
2026-01-13 14:00:21
817
原创 沐曦已支持TileLang,性能比肩国际主流
近日,DeepSeek宣布在其新版本中拥抱国产GPU语言TileLang,引发业界广泛关注。作为国产高性能GPU的代表,沐曦曦云C系列产品已率先在这一新兴开源社区获得支持。TileLang项目是由TileLang社区主导开发,旨在简化高性能GPU/CPU内核的开发。它采用Python式语法,让开发者能够专注于提高生产力,而无需牺牲实现最佳性能所需的底层优化。
2026-01-11 13:23:16
913
原创 【原理解析】HAMi × 沐曦 MetaX | sGPU 共享、三档 QoS、拓扑智能调度与 WebUI 全面适配
近日,密瓜智能团队与沐曦团队紧密合作,基于曦云C系列产品,在 HAMi v2.7.0 版本中联合推出了统一调度方案。
2026-01-11 13:16:31
1016
原创 PaddleMaterials完成与沐曦AI芯片适配,让材料研发更智能、更高效,开启AI驱动新材料时代!
沐曦与飞桨智能材料科学开发套件PaddleMaterials携手完成深度适配与联合测试,成功验证多种材料科学智算模型在沐曦 GPU上的高效运行,充分展现了国产AI硬件在材料科学智算中的强大潜力,并彰显了国产AI基础框架×智能材料科学×GPU硬件的蓬勃生机与无限活力。
2026-01-10 10:24:10
310
原创 DLInfer助力沐曦股份曦云C500推理落地MinerU多模态场景,实现性能加速60%!
目前,DLInfer 已实现软硬适配工程中的有效解耦,支持包括 InternLM 系列、InternVL 系列、Qwen 系列、DeepSeek 系列在内的多款主流模型在多元硬件上的推理适配,支撑包括沐曦股份曦云 C500 在内的超 5 款主流硬件接入。测试结果表明,相较于算子模式,通过 DLInfer + LMDeploy 的部署方案,端到端延迟显著降低,模型推理吞吐量提升了 30%以上,为高并发推理服务提供了坚实的性能保障。LMDeploy是业界领先的大模型推理引擎,为开发者提供了灵活高效的部署方案。
2026-01-10 10:17:49
746
原创 沐曦股份MXMACA-3.3.0.X简要技术报告
近期,沐曦股份(以下简称“沐曦”)发布了MXMACA软件栈(以下简称“MACA”)的3.3.0.X版本,MACA套件是面向沐曦股份曦云C系列、曦思N系列GPU研发的异构计算软件栈核心计算平台、引擎、运维工具和规范化操作范本,作为沐曦“自主GPGPU硬件+全栈软件体系”的关键协同载体,如图1所示,MACA承担着连接硬件算力单元与上层应用生态的核心纽带作用,覆盖底层驱动、用户态接口、编译器、算子适配、训练框架、推理框架、行业场景优化等全链路能力,是支撑国产GPU生态落地与行业赋能的算力基座。
2026-01-09 11:29:01
826
原创 开源协同推动AI落地:沐曦股份携手红帽推出MXAIE方案,共建高性能AI生态
在2025红帽论坛上,沐曦股份与全球领先的企业级开源解决方案提供商红帽共同发布MXAIE解决方案。该方案不仅实现了从底层算力到平台运营的全栈整合,更通过深度参与开源社区,推动国产GPU与全球AI框架的生态融合。
2026-01-09 11:05:23
460
原创 沐曦股份曦云C系列GPU Day 0适配智谱GLM-4.6V
作为 GLM 系列在多模态方向上的一次重要迭代,GLM-4.6V 将训练时上下文窗口提升到 128k tokens,在,并首次在模型架构中将,打通从「视觉感知」到「可执行行动(Action)」的链路,为真实业务场景中的多模态 Agent 提供统一的技术底座。
2026-01-08 15:00:16
384
原创 大晓机器人开悟世界模型3.0与沐曦股份下一代GPU Day 0适配,共同抢占空间智能新高地
12月18日,大晓机器人与沐曦股份正式签署战略合作协议,依托双方核心资源禀赋,聚焦技术创新、产品研发、生态构建、商业落地等领域,开悟世界模型3.0与沐曦C系列GPU成功适配,性能全面赶超国际顶尖芯片,实现国产算力对具身智能核心场景的支持,共同推动国产化软硬一体生态的构建与发展,形成从底层算力到上层智能应用的协同合力,为具身智能产业的自主可控发展注入新动能。
2026-01-07 11:33:00
824
原创 曦云C500/C550 Day 0适配 Tencent-HY-MT1.5
共包含两个模型:Tencent-HY-MT1.5-1.8B和Tencent-HY-MT1.5-7B,两个模型均重点支持33个语种互译以及5种民汉/方言,除了中文、英语、日语等常见语种,也包含捷克语、马拉地语、爱沙尼亚语、冰岛语等小语种。沐曦与腾讯混元长期保持合作关系,依托全栈自研算力底座,持续为混元大模型提供自主可控的训推一体支撑,实现国产算力与国产大模型的深度协同。沐曦与腾讯混元长期保持合作关系,依托全栈自研算力底座,持续为混元大模型提供自主可控的训推一体支撑,实现国产算力与国产大模型的深度协同。
2026-01-07 11:17:16
212
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅