自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 CANN与大模型推理:高效部署百亿参数语言模型的实践指南

CANN与大模型推理:高效部署百亿参数语言模型的实践指南

2026-02-07 00:11:45 296

原创 CANN自定义算子开发指南:扩展AI模型能力的底层利器

CANN自定义算子开发指南:扩展AI模型能力的底层利器

2026-02-07 00:08:19 636

原创 CANN内存管理全解析:从统一虚拟地址到高效显存复用

CANN内存管理全解析:从统一虚拟地址到高效显存复用

2026-02-06 22:42:56 368

原创 CANN图引擎深度解析:从计算图构建到自动优化的全流程

CANN图引擎深度解析:从计算图构建到自动优化的全流程

2026-02-06 22:38:17 298

原创 Ascend C 算子开发终极实战:实现支持动态分组的 `GroupNorm` 自定义算子(含反向传播与性能调优)

Ascend C 算子开发终极实战:实现支持动态分组的 `GroupNorm` 自定义算子(含反向传播与性能调优)

2025-12-11 22:28:15 988

原创 Ascend C 算子开发实战:实现支持稀疏输入的 `SparseMatMul` 算子(COO格式加速矩阵乘)

Ascend C 算子开发实战:实现支持稀疏输入的 `SparseMatMul` 算子(COO格式加速矩阵乘)

2025-12-11 22:22:01 1209

原创 【昇腾算力巅峰】深度解构 Ascend C 算子开发:从微架构指令调度到生产级融合算子优化(附 Tiling 自动调优、UB Cache 建模与全栈性能火焰图)

【昇腾算力巅峰】深度解构 Ascend C 算子开发:从微架构指令调度到生产级融合算子优化(附 Tiling 自动调优、UB Cache 建模与全栈性能火焰图)

2025-12-10 22:37:26 1301

原创 [特殊字符][特殊字符] 深度解析 Ascend C 算子开发:基于达芬奇架构的高性能张量计算编程范式(附 Tiling 优化、UB Cache 利用与性能火焰图)

🔥🔥 深度解析 Ascend C 算子开发:基于达芬奇架构的高性能张量计算编程范式(附 Tiling 优化、UB Cache 利用与性能火焰图)

2025-12-10 22:26:21 994

原创 # Ascend C 算子开发进阶实战:实现支持任意形状广播的 `Add` 算子(含 Tiling 分块与性能优化)

Ascend C 算子开发进阶实战:实现支持任意形状广播的 `Add` 算子(含 Tiling 分块与性能优化)

2025-12-09 20:23:14 1051

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除