为什么需要激活函数
全连接层只是对数据做仿射变换(affine transformation),而多个仿射变换的叠加仍然是一个仿射变换。解决问题的一个方法是引入非线性变换,例如对隐藏变量使用按元素运算的非线性函数进行变换,然后再作为下一个全连接层的输入。这个非线性函数被称为激活函数(activation function)。下面我们介绍几个常用的激活函数。
常用的激活函数
3.8.2.1 ReLU函数
ReLU(x)=max(x,0)
3.8.2.2 sigmoid函数
sigmoid(x)=1/(1+exp(−x)
3.8.2.3 tanh函数(双曲正切)