- 博客(9)
- 收藏
- 关注
原创 Ascend C 算子开发终极实战:实现支持动态分组的 `GroupNorm` 自定义算子(含反向传播与性能调优)
Ascend C 算子开发终极实战:实现支持动态分组的 `GroupNorm` 自定义算子(含反向传播与性能调优)
2025-12-11 22:28:15
988
原创 Ascend C 算子开发实战:实现支持稀疏输入的 `SparseMatMul` 算子(COO格式加速矩阵乘)
Ascend C 算子开发实战:实现支持稀疏输入的 `SparseMatMul` 算子(COO格式加速矩阵乘)
2025-12-11 22:22:01
1209
原创 【昇腾算力巅峰】深度解构 Ascend C 算子开发:从微架构指令调度到生产级融合算子优化(附 Tiling 自动调优、UB Cache 建模与全栈性能火焰图)
【昇腾算力巅峰】深度解构 Ascend C 算子开发:从微架构指令调度到生产级融合算子优化(附 Tiling 自动调优、UB Cache 建模与全栈性能火焰图)
2025-12-10 22:37:26
1301
原创 [特殊字符][特殊字符] 深度解析 Ascend C 算子开发:基于达芬奇架构的高性能张量计算编程范式(附 Tiling 优化、UB Cache 利用与性能火焰图)
🔥🔥 深度解析 Ascend C 算子开发:基于达芬奇架构的高性能张量计算编程范式(附 Tiling 优化、UB Cache 利用与性能火焰图)
2025-12-10 22:26:21
994
原创 # Ascend C 算子开发进阶实战:实现支持任意形状广播的 `Add` 算子(含 Tiling 分块与性能优化)
Ascend C 算子开发进阶实战:实现支持任意形状广播的 `Add` 算子(含 Tiling 分块与性能优化)
2025-12-09 20:23:14
1051
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅