梯度消失和梯度爆炸定义:
它的定义经常被人们搞不清楚,看似和梯度有关系,但是从吴恩达的视频来看,梯度消失和梯度爆炸指的是——后面层神经元的值变得非常大或者非常小。
当w仅仅比1大一点点,那么随着层数的增加,后边神经元的值会越来越大,叫做梯度爆炸;
当w仅仅比1小一点点,那么随着层数的增加,后边神经元的值会越来越小,叫做梯度消失。
梯度消失和梯度爆炸的解决方案:
- 将w的初始值设的合理
它的定义经常被人们搞不清楚,看似和梯度有关系,但是从吴恩达的视频来看,梯度消失和梯度爆炸指的是——后面层神经元的值变得非常大或者非常小。
当w仅仅比1大一点点,那么随着层数的增加,后边神经元的值会越来越大,叫做梯度爆炸;
当w仅仅比1小一点点,那么随着层数的增加,后边神经元的值会越来越小,叫做梯度消失。