【学习笔记】如何理解 transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])

最新推荐文章于 2024-05-14 18:57:01 发布

ERCO123

最新推荐文章于 2024-05-14 18:57:01 发布

阅读量2.4w

点赞数 48

分类专栏：笔记问题解决文章标签：深度学习机器学习 python

本文链接：https://blog.csdn.net/KaelCui/article/details/106175313

版权

笔记同时被 2 个专栏收录

124 篇文章 4 订阅

订阅专栏

问题解决

32 篇文章 2 订阅

订阅专栏

前面的（0.5，0.5，0.5）是 R G B 三个通道上的均值，后面(0.5, 0.5, 0.5)是三个通道的标准差，
Normalize对每个通道执行以下操作：image =（图像-平均值）/ std在您的情况下，参数mean，std分别以0.5和0.5的形式传递。这将使图像在[-1,1]范围内归一化。例如，最小值0将转换为（0-0.5）/0.5=-1，最大值1将转换为…

注意通道顺序是 R G B ，用过opencv的同学应该知道openCV读出来的图像是 BRG顺序。这两个tuple数据是用来对RGB 图像做归一化的，如其名称 Normalize 所示这里都取0.5只是一个近似的操作，实际上其均值和方差并不是这么多，但是就这个示例而言影响可不计。

精确值是通过分别计算R,G,B三个通道的数据算出来的，
比如你有2张图片，都是100100大小的，那么两图片的像素点共有2100*100 = 20 000 个；那么这两张图片的
1. mean求法：
mean_R: 这20000个像素点的R值加起来，除以像素点的总数，这里是20000；mean_G 和mean_B 两个通道的计算方法一样的。

2. 标准差求法：
首先标准差就是开了方的方差，所以其实就是求方差，方差公式就是我们数学上的那个求方差的公式：

也是3个通道分开算，
比如算R通道的，这里X就为20000个像素点各自的R值，再减去R均值，上面已经算好了；
然后平方；
然后20000个像素点相加，然后求平均除以20000，
得到R的方差，再开方得标准差。
注意！！！
如果你用的是自己创建的数据集，从头训练，那最好还是要自己统计自己数据集的这两个量

你加载的的是pytorch上的预训练模型，自己只是微调模型；
或者你用了常见的数据集比如VOC或者COCO之类的，但是用的是自己的网络结构，即pytorch上没有可选的预训练模型那么可以使用一个pytorch上给的通用的统计值：
mean=[0.485, 0.456, 0.406],std=[0.229, 0.224, 0.225]),即

transforms.Normalize((0.485, 0.456, 0.406), (0.229, 0.224, 0.225))])

参考1

ERCO123

关注

48
点赞
踩
104

收藏

觉得还不错? 一键收藏
5
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录