在tensorflow中,改变试图,是经常用的操作。tensorflow中彩色图像传入的格式是RGB,这和其他一些框架不一样。
在理解多维数组的时候,可以按照(batch_size,height,width,channel)理解,对应彩色图像是RGB(在caffe中,传入的是channel,height,width)
二维数组的理解,(height,width)。 存储从小维度开始,即x[h0][w0],x[h0][w1],x[0][w2], 即先存储1,2,3.。
三维数组的理解,(height,width,channel),从右下图直观理解,三位通道格式的图片读入即是如此。
同时,在处理得到热点图,我们可以直接用 tf.argmax(x,axis=-1),来得到在通道这一个维度上的最大值,生成热点图。
四维数组的理解,(batch_size,height,width,channel)四维图像可以看成多张图片。
在维度上,我们可以这样理解,进行记忆 三维和四维分别如下
在tensorflow中,有argmax argmin等函数可以用到axis 。在增加删除维度axis,都可以用到