- 博客(2)
- 收藏
- 关注
原创 基于CANN mindspore-npu仓库:AIGC多模态生成的端侧部署方案
mindspore-npu是CANN生态中MindSpore框架与昇腾NPU的端侧适配仓库,聚焦于解决AIGC多模态生成技术在端侧设备(手机、边缘盒子、智能终端)部署时的“轻量化”“低功耗”“低延迟”三大核心痛点。随着AIGC技术从云端走向端侧,用户对实时性(如端侧AI绘画、语音生成)、隐私保护(本地数据不上传)的需求日益增长,但端侧设备的算力、内存、功耗受限,传统云端AIGC模型无法直接部署。◦ 针对昇腾NPU端侧芯片(如昇腾310B)的硬件架构,优化算子执行流程,将多个连续算子融合为单一Kernel。
2026-02-06 19:11:42
318
原创 CANN生态pytorch-npu仓库解读:AIGC大模型训练的硬件加速利器
CANN生态的pytorch-npu仓库,是华为专为PyTorch框架与昇腾NPU硬件打造的深度适配组件,核心目标是解决AIGC大模型训练过程中的“跨框架兼容”与“算力释放”两大痛点。pytorch-npu通过底层算子适配、框架接口封装,实现了PyTorch模型与昇腾NPU的无缝对接,让AIGC开发者无需修改核心代码,即可享受昇腾NPU的高并行计算能力。◦ 性能收益:LLaMA-7B训练时,FP16精度下显存占用降低50%,训练速度提升30%,生成文本的BLEU值仅下降0.8%
2026-02-06 19:07:48
498
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅