前面博客中已经对 axis 进行了详细的讲解,这篇博客继续强化一下对 axis 的理解,因为矩阵运算中 axis 是一个非常重要的概念。
以 3D 图像为例:上面的 3D 图像的维度是 2 × 2 × 2 ,即每个小立方体(体素)存储着一个灰度值。
现在假设有以下三个 3D图像:
- [[[1, 2], [3, 4]], [[5, 6], [7, 8]]]
- [[[11, 12], [13, 14]], [[15, 16], [17, 18]]]
- [[[21, 22], [23, 24]], [[25, 26], [27, 28]]]
形象地展示一下第一个图像:
现在有一个需求:在三幅图像同样的位置提取一定体积的体素?比如,提取右上角体积为 1 × 1 × 1 的立方体,即 [1, 11, 21] 三个元素。
import tensorflow as tf
t1 = tf.constant([[[1, 2], [3, 4]], [[5, 6], [7, 8]]])
t2 = tf.constant([[[11, 12], [13, 14]], [[15, 16], [17, 18]]])
t3 = tf.constant([[[21, 22], [23, 24]], [[25, 26], [27, 28]]])
a = tf.stack([t1, t2, t3], axis=0)
b = tf.stack([t1, t2, t3], axis=-1)
with tf.Session() as sess:
print("----1----")
print(sess.run(a))
print("----2----")
print(sess.run(a[:, 0:1, 0:1, 0:1]))
print("----3----")
print(sess.run(b))
print("----4----")
# 注意维度上的区别
print(sess.run(b[0:1, 0:1, 0:1, :]))
现在来对结果进行分析:
第二个输出是直接将原始3D图像堆叠,然后提取了3幅图像第一个体素;
第四个输出是将元素的对应体素先进行合并,增加一个维度,再提取这个合并的维度的所有体素。
如果想把第四种方式提取出来三个体素独立成 3幅 1 × 1 × 1 的图像可以使用下列方式:
image_T1, image_T2, label = tf.unstack(b[0:1, 0:1, 0:1, :], 3, axis=-1)
print("***********")
print(sess.run(image_T1))
print(sess.run(image_T2))
print(sess.run(label))
小结:
tf.stack() 矩阵拼接函数,即将秩为 R 的张量列表堆叠成一个秩为 (R+1) 的张量,而参数 axis 决定了从哪个维度堆叠, 从外到内依次为0,1,2…
将 values 中的张量列表堆叠成一个新张量,新张量比 values 中的每个张量都高一个秩,通过沿 axis 维度堆叠。给定一个形状为(A, B, C)的张量的长度 N 的列表:
如果 axis == 0,那么 output 张量将具有形状(N, A, B, C)。
如果 axis == 1,那么 output 张量将具有形状(A, N, B, C)。
如果 axis == 2,那么 output 张量将具有形状( A, B, N, C)。
如果 axis == 3,那么 output 张量将具有形状(A, B, C, N)。
tf.unstack() 是一个拆分矩阵的函数,将秩为 R 的张量的给定维度出栈为秩为 (R-1) 的张量。其中,参数 num 要与该 axis维度 元素个数相等,否则会报错。