极智AI | 谈谈为什么卷积加速更喜欢 NHWC Layout

极智视界

已于 2022-06-21 22:07:50 修改

阅读量2.6k

点赞数 4

分类专栏：极智AI 文章标签：卷积卷积神经网络深度学习人工智能

于 2021-08-03 14:46:10 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42405819/article/details/119348563

版权

极智AI 专栏收录该内容

175 篇文章 ¥49.90 ¥99.00

订阅专栏

超级会员免费看

本文探讨卷积神经网络中，为何NHWC数据布局相比NCHW在加速算法如img2col+gemm和winograd中更具优势。NHWC布局优化了特征图数据的读取过程，减少了数据访问次数，从而提升卷积运算效率，尤其在高维度卷积中效果更为显著。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文主要讨论一下为什么卷积加速更加喜欢 NHWC 的数据排布。

我目前接触过的数据排布类型(主要针对卷积)有 NCHW (pytorch、caffe)，NHWC (Tensorflow，也是 TVM GPU 和寒武纪 MLU Core 上更喜欢的 data Layout)， CHW (TensorRT里不考虑动态batch的话是把 N 拿出来了，只剩三维)，NCHWC0 (华为昇腾 AI Core 的五维 Layout，C0 INT8时为32，FP16时为16)。为什么会有这么多数据类型排布呢，原因可能是源于不同的训练框架，比如 pytorch 和 tensorflow (大部分人的炼丹炉) 就不一样，而在推理时，更多的会考虑硬件 / 推理性能更喜欢什么样的数据类型排布。

这里主要谈谈对于 img2col+gemm 和 winograd 卷积加速算法来说，为什么 NHWC 比 NCHW 更合适 (GPU上)，也是我个人的理解。

文章目录

- 1、img2col+gemm 和 winograd 算法原理
- 2、为什么 NHWC 更好

1、img2col+gemm 和 winograd 算法原理

img2col+gemm 的详细原理可以看我的这篇

了解本专栏

超级会员免费看

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

极智视界 你的支持是我持续创作的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。