自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 【昇腾CANN】changelog自动化:用脚本省掉80%的版本记录工作

每次发版前最烦人的事情是什么?写 changelog。翻一个月的 commit history,对着一堆 `fix typo`、`update readme`、`wip`、`asdf` 这样的 commit message,欲言又止。release-management 仓库里的 changelog 自动化模块,解决的就是这个问题。

2026-05-25 11:23:35 230

原创 【昇腾CANN】release-management:我从1.0到2.0发布踩过的那些坑

开源项目发版本这事,看着简单——打个tag、改个changelog、push上去就行了。真到实际操作的时候,每个环节都能给你整出点意外。release-management 这个仓库就是来解决这些问题的。它本质上是昇腾CANN社区的发布规范层,把版本号怎么定、changelog 怎么写、发布流程怎么跑这些问题固化下来,避免每个 maintainer 各搞各的。

2026-05-25 11:21:56 227

原创 【昇腾CANN】ops-fft:让傅里叶变换不再是玄学

你有没有遇到过这种情况:做信号处理,用NumPy的FFT算个1024点变换,要算半天。后来发现昇腾CANN有个ops-fft库,专门加速FFT计算,同样的计算在NPU上只要几毫秒。这篇文章就来讲讲FFT是啥、为啥要优化、怎么用ops-fft库。

2026-05-24 17:04:32 352

原创 【昇腾CANN】ops-blas线性代数库:让矩阵计算快起来

之前做科学计算,最头疼的就是大矩阵乘法。用NumPy在CPU上跑,一个1024×1024的矩阵乘就要200ms。后来发现ops-blas这个库,专门优化线性代数计算,同样的计算在昇腾NPU上只要15ms。这篇文章就来讲讲这个库的使用方法。

2026-05-24 17:02:57 419

原创 【昇腾CANN】电力巡检AI实战:昇腾NPU让缺陷检测快起来

去年帮一家电力公司做输电塔缺陷检测,原来用GPU推理,一张图片要200ms,实时性根本不够。迁到昇腾NPU后,用ops-cv和ATB优化,一张图片只要60ms,实时巡检终于可行了。这篇文章就来讲讲这个实战项目。

2026-05-23 15:21:45 370

原创 【昇腾CANN】cann-samples:开源社区的“代码食谱“

刚接触昇腾CANN那会,我最头疼的就是"知道算子存在,但不知道怎么用"。官方文档讲原理讲得很清楚,但就是没代码。后来发现cann-samples这个仓库,里面全是可运行的代码示例,直接抄就能用。

2026-05-23 15:15:51 416

原创 【昇腾CANN】asnumpy快速上手:让NumPy在NPU上跑起来

之前做数值计算,一直用NumPy在CPU上跑。数据量一大,CPU就扛不住了。后来发现asnumpy这个库,让NumPy的API直接在昇腾NPU上跑,速度快了10倍不止。这篇文章就来讲讲这个库的使用方法。

2026-05-22 22:01:24 348

原创 【昇腾CANN】ops-math算子库深度解析:让数学计算快起来

去年做一个科学计算项目,需要大量三角函数和指数运算。用PyTorch原生算子在昇腾NPU上跑得特别慢。后来发现ops-math这个库,专门为数学类算子做了优化,性能直接提升了3倍。这篇文章就来讲讲这个库的使用方法。

2026-05-22 22:00:26 355

原创 【昇腾CANN】ops-cv算子库深度解析:让计算机视觉跑得更快

【昇腾CANN】ops-cv算子库深度解析:让计算机视觉跑得更快

2026-05-21 23:21:12 671

原创 【昇腾CANN】community仓库:参与开源社区的正确姿势

【昇腾CANN】community仓库:参与开源社区的正确姿势

2026-05-21 23:20:07 625

原创 CANN在计算机视觉场景中的深度优化:从目标检测到视频分析的端到端加速

CANN在计算机视觉场景中的深度优化:从目标检测到视频分析的端到端加速

2026-02-07 00:21:08 273

原创 CANN开发调试全攻略:从日志分析到性能瓶颈定位

CANN开发调试全攻略:从日志分析到性能瓶颈定位

2026-02-06 23:06:05 335

原创 CANN与主流深度学习框架集成指南:无缝迁移TensorFlow/PyTorch模型

CANN与主流深度学习框架集成指南:无缝迁移TensorFlow/PyTorch模型

2026-02-06 23:03:43 755

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除