3.8 MLP多层感知机(multilayer perceptron)
“
- 多层感知机在输出层与输入层之间加入了一个或多个全连接隐藏层,并通过激活函数对隐藏层输出进行变换。
”
作者点出在输入和输出层中引入隐藏层其实等价于仅含输出的单层网络,从线性代数的角度理解,隐藏层的添加只是对输入做仿射变换,只有引入非线性函数才会有“质”的不同。我们称这些非线性函数为激活函数:relu sigmoid tanh
防止过拟合的方法:权重衰减+丢弃法(dropout)
3.12 权重衰减
权重衰减等价于 L2 范数正则化(regularization),为模型损失函数添加惩罚项使学出的模型参数值较小,是应对过拟合的常用手段