- 博客(13)
- 收藏
- 关注
原创 【昇腾CANN】changelog自动化:用脚本省掉80%的版本记录工作
每次发版前最烦人的事情是什么?写 changelog。翻一个月的 commit history,对着一堆 `fix typo`、`update readme`、`wip`、`asdf` 这样的 commit message,欲言又止。release-management 仓库里的 changelog 自动化模块,解决的就是这个问题。
2026-05-25 11:23:35
230
原创 【昇腾CANN】release-management:我从1.0到2.0发布踩过的那些坑
开源项目发版本这事,看着简单——打个tag、改个changelog、push上去就行了。真到实际操作的时候,每个环节都能给你整出点意外。release-management 这个仓库就是来解决这些问题的。它本质上是昇腾CANN社区的发布规范层,把版本号怎么定、changelog 怎么写、发布流程怎么跑这些问题固化下来,避免每个 maintainer 各搞各的。
2026-05-25 11:21:56
227
原创 【昇腾CANN】ops-fft:让傅里叶变换不再是玄学
你有没有遇到过这种情况:做信号处理,用NumPy的FFT算个1024点变换,要算半天。后来发现昇腾CANN有个ops-fft库,专门加速FFT计算,同样的计算在NPU上只要几毫秒。这篇文章就来讲讲FFT是啥、为啥要优化、怎么用ops-fft库。
2026-05-24 17:04:32
352
原创 【昇腾CANN】ops-blas线性代数库:让矩阵计算快起来
之前做科学计算,最头疼的就是大矩阵乘法。用NumPy在CPU上跑,一个1024×1024的矩阵乘就要200ms。后来发现ops-blas这个库,专门优化线性代数计算,同样的计算在昇腾NPU上只要15ms。这篇文章就来讲讲这个库的使用方法。
2026-05-24 17:02:57
419
原创 【昇腾CANN】电力巡检AI实战:昇腾NPU让缺陷检测快起来
去年帮一家电力公司做输电塔缺陷检测,原来用GPU推理,一张图片要200ms,实时性根本不够。迁到昇腾NPU后,用ops-cv和ATB优化,一张图片只要60ms,实时巡检终于可行了。这篇文章就来讲讲这个实战项目。
2026-05-23 15:21:45
370
原创 【昇腾CANN】cann-samples:开源社区的“代码食谱“
刚接触昇腾CANN那会,我最头疼的就是"知道算子存在,但不知道怎么用"。官方文档讲原理讲得很清楚,但就是没代码。后来发现cann-samples这个仓库,里面全是可运行的代码示例,直接抄就能用。
2026-05-23 15:15:51
416
原创 【昇腾CANN】asnumpy快速上手:让NumPy在NPU上跑起来
之前做数值计算,一直用NumPy在CPU上跑。数据量一大,CPU就扛不住了。后来发现asnumpy这个库,让NumPy的API直接在昇腾NPU上跑,速度快了10倍不止。这篇文章就来讲讲这个库的使用方法。
2026-05-22 22:01:24
348
原创 【昇腾CANN】ops-math算子库深度解析:让数学计算快起来
去年做一个科学计算项目,需要大量三角函数和指数运算。用PyTorch原生算子在昇腾NPU上跑得特别慢。后来发现ops-math这个库,专门为数学类算子做了优化,性能直接提升了3倍。这篇文章就来讲讲这个库的使用方法。
2026-05-22 22:00:26
355
原创 CANN与主流深度学习框架集成指南:无缝迁移TensorFlow/PyTorch模型
CANN与主流深度学习框架集成指南:无缝迁移TensorFlow/PyTorch模型
2026-02-06 23:03:43
755
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅