- 博客(4)
- 收藏
- 关注
原创 Ascend C 高级编程指南:从原理到工业级算子开发
在上一篇文章中,我们介绍了 Ascend C 的基本概念和入门方法。然而,在真实的工业场景中,一个高性能、高可靠性的自定义算子远不止“能跑”那么简单。它需要考虑数值稳定性、边界处理、多精度支持、错误恢复、性能可移植性等一系列工程问题。本文将深入 Ascend C 的高级编程技术,涵盖等关键主题,并通过一个完整的展示从设计到部署的全流程。本文适合已有 Ascend C 基础、希望将其应用于生产环境的开发者。
2025-12-21 11:12:28
629
原创 深入理解 Ascend C:华为昇腾 AI 芯片的高性能编程语言
支持的 GCC 版本(如 7.3.0)my_op/├── src/└── test/LLM 中常用的 SwiGLU 无法被标准算子覆盖,可用 Ascend C 高效实现。
2025-12-21 11:09:58
669
原创 从零开始用 Ascend C 开发高性能自定义算子:实战指南与性能调优
/ 每个核处理 256 个元素// FP16 向量指令每次处理 16 个public:i < loop;CopyOut(i);private:private:func_type="aot" # Ahead-of-Time 编译。
2025-12-18 21:41:57
701
原创 Ascend C 全面解析:从昇腾架构到高性能算子开发实战
国产AI算力崛起推动编程新范式发展。华为昇腾AI处理器凭借高能效比和软硬协同设计构建自主可控AI基础设施,其专用编程语言AscendC(基于C++扩展)可充分发挥芯片性能。文章系统解析AscendC的设计原理、内存模型和并行机制,通过VectorAdd等算子案例展示开发流程。该语言融合硬件抽象与编译器优化,支持显式内存管理和AI指令集,为开发者提供高性能算子开发方案。同时介绍开发环境搭建、项目结构及与MindSpore的集成方法,助力国产AI生态建设。2025年CANN训练营将提供系列课程,帮助开发者掌握A
2025-12-18 21:38:43
694
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅