论文笔记: Deep Residual Learning for Image Recognition
目标:利用残差网络是的训练更加简单
面对的问题:
degradation Problem: 当添加的网络层次变多,精确度逐渐饱和,网络层次将趋近饱和。
Intuition:
文中的想法是将堆叠的感知器学习原有输出的残差。
具体表示是:假设 H ( x ) \mathcal{H}(\mathbf{x}) H(x)为表示某几层感知器的, x x x是输入。那么我们令 F ( x ) : = H ( x ) − x \mathcal{F}(\mathbf{x}):=\mathcal{H}(\mathbf{x})-\mathbf{x} F(x):=H(x)−x
那么原来的输出将变成: F ( x ) + x = H ( x ) \mathcal{F}(\mathbf{x})+\mathbf{x} =\mathcal{H}(\mathbf{x}) F(x)+