- 博客(5)
- 收藏
- 关注
原创 《深入理解 Ascend C:华为昇腾 AI 芯片的高性能编程新范式》引言:AI 算力瓶颈与异构编程的演进
2025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入门系列、码力全开特辑、开发者案例等专题课程,助力不同阶段开发者快速提升算子开发技能。获得Ascend C算子中级认证,即可领取精美证书,完成社区任务更有机会赢取华为手机,平板、开发板等大奖。报名链接:https://www.hiascend.com/developer/activities/cann20252。
2025-12-19 15:39:35
1009
原创 《深入Ascend C(下):征服Matrix Multiplication与高级优化技巧》
从Vector Add到MatMul,我们系统地学习了Ascend C的核心编程范式和高级优化技巧。Ascend C不仅仅是一门语言,它更是一种。
2025-12-18 15:51:25
750
原创 《深入Ascend C(上):从零构建你的第一个高性能算子》
本文将作为《深入Ascend C》系列的第一篇,带领读者从零开始,系统性地理解Ascend C的核心设计理念、内存模型、数据搬运机制,并手把手实现一个经典的Vector Add(向量加法)算子,为后续更复杂的算子开发奠定坚实基础。在AI模型训练与推理的浪潮中,硬件性能的提升是永恒的主题。真实的AI算子(如Conv2D, MatMul)远比Vector Add复杂,它们需要更精细的数据排布(tiling strategy)、更复杂的计算调度(fusion)以及对Cube Unit的充分利用。
2025-12-18 15:46:44
950
原创 《Ascend C 深度解析:昇腾 AI 芯片的高性能算子编程范式》
2025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入门系列、码力全开特辑、开发者案例等专题课程,助力不同阶段开发者快速提升算子开发技能。获得Ascend C算子中级认证,即可领取精美证书,完成社区任务更有机会赢取华为手机,平板、开发板等大奖。报名链接:https://www.hiascend.com/developer/activities/cann20252。
2025-12-17 10:54:43
801
原创 《实战 Ascend C:从零实现高性能自定义卷积算子》
/ 输入/输出/权重描述// 分块参数(需根据 UB 大小调整)// Batch 分块// 输出通道分块(对齐 Cube 的 16x16)// 高度分块// 宽度分块💡 昇腾 Cube 单元一次处理 16x16 的 FP16 矩阵,因此通道维度建议 16 对齐。2025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入门系列、码力全开特辑、开发者案例等专题课程,助力不同阶段开发者快速提升算子开发技能。
2025-12-17 10:43:26
874
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅