目的是为了:把输入的值银蛇到N(0, 1)的均匀分布上
μ,sigma是当前batch的
runing是所有数据的μ, sigma
γ与β是超参数
训练的时候使用当前batch的均值和方差,会保存到总体的均值和方差
代码:
# 因为在必须使用sigmoid函数情况下在两极是梯度很小的,没有什么作用
# 所以我要使用BN把这个没有用的梯度映射到有用的数值
# 这样我就可以把输出的数值映射到一个N(0, a2)分布上
# Feature Scaling
# 技巧一:Image Normalization
import torch
from torch import nn
from torchvision import transforms
normalize = transforms.Normalize( # 这一步是把图片的RGB通映射到N(0,a方)
mean=[0.485,