1. 什么是梯度消散? 如下图u介绍,当用sigmod函数时,当z过大或过小会发现梯度(斜率)接近水平,变成0了,即梯度消失 2. 解决方法 思路一 使用relu函数,因为relu函数z小于0是,结果恒为0,z大于0时,结果为z本身,这样就是一条45度的直线,梯度永远不变,即不会消失 不饱和激活函数 leaky relu 如下图,解决了relu在小于0的时候的不足,需自己实现 elu, 如下图,解决了leaky relu在z=0处不可导的问题,已封装好,直接使用,但是求曲线处的斜率计算相对复杂