- 博客(5)
- 收藏
- 关注
原创 CANN 自动混合精度训练指南
训练大模型需要海量算力,而自动混合精度(AMP)是提升效率的关键。CANN 原生支持 AMP,可在几乎不损精度的前提下,显著加速训练并降低显存占用。
2026-02-07 00:16:26
49
原创 CANN 推理实战:从 ONNX 到高性能部署
将训练好的模型高效部署到边缘或云端,是 AI 落地的关键一步。CANN(Compute Architecture for Neural Networks)提供端到端的推理解决方案,支持模型转换、量化、多流并发与容器化部署。
2026-02-07 00:15:49
60
原创 CANN 架构入门:AI 加速的全栈软件基石
CANN 并非单一工具,而是一套从底层驱动到高层 API 的完整软件体系。它专为 AI 计算设计,支持训练与推理,兼容主流框架,并通过软硬协同实现极致效率。其核心优势在于分层解耦 + 全栈优化:上层开发者无需关心硬件细节,底层则针对特定架构深度调优。当内置算子不足时,可通过 TBE(Tensor Boost Engine)编写自定义算子。例如一个简单的平方算子:python编译后即可在模型中调用,无缝集成。
2026-02-06 22:03:49
284
2
原创 CANN:面向AI计算的异构架构软件栈详解
CANN作为面向AI计算的异构软件栈,通过软硬协同设计,在性能、易用性与生态兼容性之间取得了良好平衡。无论是科研探索还是工业部署,它都为开发者提供了一条高效、可靠的AI加速路径。随着工具链的不断完善与社区的壮大,CANN有望成为下一代AI基础设施的重要组成部分。
2026-02-06 21:43:53
575
原创 C语言入门:从零开始写你的第一个程序
C语言作为编程界的“常青树”,是很多程序员的入门语言。它语法简洁、功能强大,也是学习数据结构、操作系统等课程的基础。如果你刚接触编程,这篇文章将带你从零开始写一个简单的 C 语言程序,并理解它的基本结构。
2026-01-21 16:07:34
274
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅