Tensorflow张量和维度概念的理解
理解tensorflow张量的概念:张量就是一个数据存储容器,一种数据结构,是人为定义的.因为在计算机内存中哪里有什么2维空间3维空间,都是一块块连续的内存区域.
理解tensorflow定义的维度的概念:一个维度其实就是一个层级的列表,即一个’[]'里的内容,
以tf.nn.conv2d
函数为例,对于输入图像,tensorflow要求他是4维的;
每个维度依次代表(batch_size, height, width, channels).所以第4维,也就是最里面那一级列表,存储的是通道维度方向的内容.
这就跟自己写一个两层嵌套列表是一样的,是自己定义的一个数据结构,你定义里边一层列表存储行数据,外边一层列表存储列数据,所以你就写了一个这个[[1,2,3],[4,5,6],[7,8,9]],在处理的时候,你会按照自己定义的数据结构去处理.
例子
假设现在有一个
3
×
3
3\times3
3×3的两通道图像,要送入conv2d做卷积,那请问你应该怎么定义它呢?
channel 1:
1
2
3
4
5
6
7
8
9
\begin{matrix} 1 & 2 & 3 \\ 4 & 5 & 6 \\ 7 & 8 & 9\end{matrix}
147258369
channel 2:
5
6
7
6
5
4
7
5
2
\begin{matrix} 5 & 6 & 7 \\ 6 & 5 & 4 \\ 7 & 5 & 2\end{matrix}
567655742
我的答案如下:
把他们写到一起作为一个input,形状就应该是(1,3,3,2), 即
input = np.array([[
[[1,5],[2,6],[3,7]],
[[4,6],[5,5],[6,4]],
[[7,7],[8,5],[9,2]],
]])
这里[1,5]就代表左上角这个位置各个通道在深度方向上的信息,他在第4层括号里,也就是第4个维度上,channel维度的信息。
参考链接:Tensorflow官网tf.nn.conv2d:https://tensorflow.google.cn/api_docs/python/tf/nn/conv2d?hl=en