说明:用于自己复习、理解知识点所用
反向传播
什么是反向传播?
“正向传播”求损失,“反向传播”回传误差。神经网络每层的每个神经元都可以根据误差信号修正每层的权重。误差反向传播通常与梯度下降法结合来训练神经网络,梯度下降法通过计算损失函数的梯度,将这个梯度反馈给最优化函数来更新权重以最小化损失函数。
反向传播的两个步骤:
①计算每个神经元的误差
y为我们神经网络的预测值,预测值和对应数据的标签来比较,计算出误差。误差的计算有很多方法,比如输出与期望的误差的平方和,熵(Entropy)以及交叉熵等。计算出的误差记为 δ。
计算完误差后,需要将这个误差不断地向前一层传播。向前一层传播时,需要考虑到前一个神经元的权重系数。反向传播时后一层的节点会与前一层的多个节点相连,因此需要对所有节点的误差求和。
②更新权重
更新权重时,我们需要知道这个权重对全体产生了多少影响,这个影响的大小可以用偏