目录
1.随机初始化(Xavier Initialization、He Initialization等)
2.使用nonsaturating函数(如relu)
3.批量归一化(Batch Normalization, BN)
4.梯度裁剪(Gradient Clipping)
目录
1.随机初始化(Xavier Initialization、He Initialization等)
2.使用nonsaturating函数(如relu)
3.批量归一化(Batch Normalization, BN)
4.梯度裁剪(Gradient Clipping)