#image的size为(w,h)即(w = 1000,h = 500)
img_arr = np.array(image)或者 img_arr = np.asarray(image) #将image转换成array
img_tesnor = trans(image) #image转换成tensor,其中函数trans自定义的。
测试可知,image在array中表示为(H,W,C)
在tensor中表示为(C,H,W)
且可以看出,在array中表示为0-255,在tensor中表示为0-1
path="img地址"
img = Image.open(path)
arr = np.array(img)
print(arr.shape)
print(arr[0].shape)
tensor = trans(img) #trans为自定义函数
print(tensor.shape)
print(tensor[0].shape)
输出
(375, 500, 3)
(500, 3)
torch.Size([3, 375, 500])
torch.Size([375, 500])
arr[0]表示取数组第0维度第0位置上的切片
tensor[0]表示取tensor第0维度上的第0位置的切片。
再如
print(arr.shape[1])
print(tensor[1].shape)
#输出
(375, 500, 3)
(500, 3)
torch.Size([3, 375, 500])
torch.Size([375, 500])
再如
print(arr[1,10].shape)
print(tensor[1,10].shape)
#输出
(375, 500, 3)
(3,)
torch.Size([3, 375, 500])
torch.Size([500])
总结:关于切片,数组和tensor是一样的。
print(arr.shape)
print(arr[1].shape)
print(arr[1].shape[0])
print(tensor.shape)
print(tensor[1].shape)
print(tensor[1].shape[0])
#输出##############################################
(375, 500, 3)
(500, 3)
500
torch.Size([3, 375, 500])
torch.Size([375, 500])
375
对于后续在shape后面再加一个[i]是说(此时的shape内容其实是一个数组)对于当前的一个内容为(375,500,3)的数组进行按索引取值。你应该能看懂。