自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 《深入理解 Ascend C:华为昇腾 AI 芯片的高性能编程新范式》引言:AI 算力瓶颈与异构编程的演进

2025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入门系列、码力全开特辑、开发者案例等专题课程,助力不同阶段开发者快速提升算子开发技能。获得Ascend C算子中级认证,即可领取精美证书,完成社区任务更有机会赢取华为手机,平板、开发板等大奖。报名链接:https://www.hiascend.com/developer/activities/cann20252。

2025-12-19 15:39:35 1009

原创 《深入Ascend C(下):征服Matrix Multiplication与高级优化技巧》

从Vector Add到MatMul,我们系统地学习了Ascend C的核心编程范式和高级优化技巧。Ascend C不仅仅是一门语言,它更是一种。

2025-12-18 15:51:25 750

原创 《深入Ascend C(上):从零构建你的第一个高性能算子》

本文将作为《深入Ascend C》系列的第一篇,带领读者从零开始,系统性地理解Ascend C的核心设计理念、内存模型、数据搬运机制,并手把手实现一个经典的Vector Add(向量加法)算子,为后续更复杂的算子开发奠定坚实基础。在AI模型训练与推理的浪潮中,硬件性能的提升是永恒的主题。真实的AI算子(如Conv2D, MatMul)远比Vector Add复杂,它们需要更精细的数据排布(tiling strategy)、更复杂的计算调度(fusion)以及对Cube Unit的充分利用。

2025-12-18 15:46:44 950

原创 《Ascend C 深度解析:昇腾 AI 芯片的高性能算子编程范式》

2025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入门系列、码力全开特辑、开发者案例等专题课程,助力不同阶段开发者快速提升算子开发技能。获得Ascend C算子中级认证,即可领取精美证书,完成社区任务更有机会赢取华为手机,平板、开发板等大奖。报名链接:https://www.hiascend.com/developer/activities/cann20252。

2025-12-17 10:54:43 801

原创 《实战 Ascend C:从零实现高性能自定义卷积算子》

/ 输入/输出/权重描述// 分块参数(需根据 UB 大小调整)// Batch 分块// 输出通道分块(对齐 Cube 的 16x16)// 高度分块// 宽度分块💡 昇腾 Cube 单元一次处理 16x16 的 FP16 矩阵,因此通道维度建议 16 对齐。2025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入门系列、码力全开特辑、开发者案例等专题课程,助力不同阶段开发者快速提升算子开发技能。

2025-12-17 10:43:26 874

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除