梯度消失与爆炸
Xavier方法与Kaiming方法
Xavier初始化
方差一致性:保持数据尺度维持在恰当范围,通常方差为1
激活函数:饱和函数,如Sigmoid,Tanh
Kaiming初始化
方差一致性:保持数据尺度维持在恰当范围,通常方差为1
激活函数:ReLU及其变种
常用初始化方法
nn.init.calculate_gain
主要功能:计算激活函数的方差变化尺度
nn.init.calculate_gain(
nonlinearity,#激活函数名称
param=None#激活函数的参数,如Leaky ReLU的negative_slop
)
十种初始化方法
1. Xavie r均匀分布
2. Xavie r正态分布
3. Kaiming均匀分布
4. Kaiming正态分布
5. 均匀分布
6. 正态分布
7. 常数分布
8. 正交矩阵初始化
9. 单位矩阵初始化
10. 稀疏矩阵初始化