激活函数的作用是对输出进行非线性变换 。注意激活函数的位置,它是加在卷积和全连接层后的! 梯度消失(sigmod函数会导致梯度消失)是指,梯度为零,因为梯度为零后,在反向传播过程中就不会再更新参数了! ReLu函数会避免梯度消失。