这是一场以误差(Error)为主导的反向传播(Back Propagation)运动,旨在得到最优的全局参数矩阵,进而将多层神经网络应用到分类或者回归任务中去
一、为什么引入反向传播
神经网络的过程就是正向传播得到Loss值,再把Loss值反向传播,并对神经网络的参数进行更新,其中反向传播正是神经网络的要点所在
即前向传递输入信号直至输出产生误差,反向传播误差信息更新权重矩阵。
至于为什么会提出反向传播算法,我直接应用梯度下降(Gradient Descent)不行吗?想必大家肯定有过这样的疑问。答案肯定是不行的,纵然梯度下降神通广大,但却不是万能的。梯度下降可以应对带有明确求导函数的情况,或者说可以应对那些可以求出误差的情况,比如逻辑回归(Logistic Regression),我们可以把它看做没有隐层的网络;