在做CIFAR图像识别的时候,想可视化一下图像
1、官网说明
发明官网的文档还真的挺好用,能够看清楚里面每个参数的细节,但就是有的例子举的比较少,可能理解没那么透彻。官网指路----> pytorch官网
2、函数的目的
官网说的目的是:Make a grid of images.,组成图像的网络,其实就是将多张图片组合成一张图片。
>>>print(images.size())
torch.Size([4, 3, 32, 32]) # 表示四张(3,32,32)的图片,cifar中的图片
# 显示一个batch的图片
def imshow(img):
img = img / 2 + 0.5 # unnormalize
npimg = img.numpy()
plt.imshow(np.transpose(npimg, (1, 2, 0))) # 将【3,32,128】-->【32,128,3】
plt.show()
image_batch = torchvision.utils.make_grid(images,padding = 0)
imshow(image_batch)
>>>print(image_batch.size())
torch.Size([3, 32, 128]) # 将四张图片横着平拼起来【3,32,32*4】
显示图片:
像官网所说,默认的padding是2,表示每张照片之间的间隔,如下图:
图片和图片之间有了空隙,就是padding的大小。