原文作者:田海立@CSDN
原文地址:https://blog.csdn.net/thl789/article/details/109037433
流行的深度学习框架中有不同的数据格式,典型的有NCHW和NHWC格式。本文从逻辑表达和物理存储角度用图的方式来理解这两种数据格式,最后以RGB图像为例来加深NHWC和NCHW数据存储格式的理解。
一、基本概念
深度学习框架中,数据一般是4D,用NCHW或NHWC表达,其中:
- N - Batch
- C - Channel
- H - Height
- W - Width
二、逻辑表达
假定N = 2,C = 16,H = 5,W = 4,那么这个4D数据,看起来是这样的:
![c23516824e8d4ea20ff9f14753cfacfa.png](https://i-blog.csdnimg.cn/blog_migrate/664ae7b1bc5c1539ff34497b8ff85272.jpeg)
人类比较直接的理解方式是3D,上图中从三个方向上理解,C方向/H方向/W方向。然后是N方向上,就是4D。
上图中红色标准的数值是这个数据里每个元素的数值。</