目录
四、权重初始化(Weight initialization)方法
五、梯度消失和梯度爆炸(Gradient vanishing/exploding)
八、批量归一化(batch normalisation (BN))减少过拟合
九、大数据增强(Data augmentation)减少过拟合
一、深度学习中最优化问题
1、最优化问题的表现形式:
2、如何解决最优化问题
(1)一阶迭代方法(梯度下降、最速下降)—— First-order iterative methods (gradient
descent, steepest descent)
通常用一阶导数来更新参数来寻求参数最优:
表现形式:
(Gradi