https://blog.csdn.net/bitcarmanlee/article/details/78819025
这个例子讲的很好
正向就是类似加权的带入
反向传播就是根据计算值和实际y 做个差,然后求导反向推算,然后推算到最前面,然后得到误差处的导数,用原来的参数 减掉误差乘以 前一阶段的系数,以此类推,进行迭代,通过多次迭代得到最终的准确结果。
需要不停地先 正向传播计算,然后反响传播计算对 各个层之间的系数进行优化,然后再正向传播计算,再反响传播优化系数,不停地迭代,最终得到正向传播计算出的结果和 最终的结果误差较小的时候,认为此时计算系数即为正确结果。
1正向传播计算相应的y值和理想的只进行比较得出loss
2反向计算loss关于w /b的导数,为梯度下降的方向
3将梯度下降数据带入 对w 和b进行更新,重新计算相应的y值和理想值的loss,发现loss会变小
4重复以上步骤,直到满足条件,停止迭代,满足了最终的计算要求的w 和b 。