参数的含义
根据源码,是对数据进行归一化的操作
image = (image - mean) / std
假设你数据的范围是图片的数据范围四[0,1],那么如果mean = [.5, .5, .5],std = [.5, .5, .5],根据上述式子计算
(0−0.5)/0.5=−1 (0-0.5)/0.5= -1(0−0.5)/0.5=−1 ,(1−0.5)/0.5=1 (1-0.5)/0.5= 1(1−0.5)/0.5=1就可将数据归一化到[-1,1]。
疑问
在pytorch的官方教程里,经常看到
normalize = T.Normalize(mean = [0.485, 0.456, 0.406],
std = [0.229, 0.224, 0.225])
ImageNet里面用你的图片不是RGB三个范围是[0,255]的图片吗,用这样的归一化参数怎么能归一化到[-1,1]呢
解答
有两种情况:
如果是imagenet数据集,那么ImageNet的数据在加载的时候就已经转换成了[0, 1].
应用了torchvision.transforms.ToTensor,其作用是
( Converts a PIL Image or numpy.ndarray (H x W x C) in the range [0, 255] to a torch.FloatTensor of shape (C x H x W) in the range [0.0, 1.0] )
所以我们常常在代码中看到normallize在ToTensor之后
self.transforms = T.Compose([
T.Scale(224),
T.CenterCrop(224),
T.ToTensor(),
normalize
]