推荐cs231n【公开课】最新斯坦福李飞飞cs231n计算机视觉课程【附中文字幕】_哔哩哔哩_bilibili
为什么需要非线性:非线性拟合能力强(表达能力强)。
对于非线性层,我们需要在构建多层网络的同时选择一种激活函数,如下图:
常见的激活函数:
一、sigmoid
最经典的激活函数
输出范围(0,1)
它把输入值做非线性映射为0到1的值,保证了严格单调递增。
缺点也很明显,1.如果输入的值绝对值过大,该函数的输出值将逼近0或1,反向传递时将导致梯度消失,2.幂运算求解耗时严重,3.深层网络收敛缓慢(均值不为0)
二、tanh