前向传递输入信号直至输出产生误差,反向传播误差信息更新权重矩阵。
为什么提出反向传播?因为神经网络中有隐藏层,隐层的误差是不存在的,因此不能直接使用梯度下降算法,而需要先将误差反向传播到隐层,再使用梯度下降算法。
参考:https://www.cnblogs.com/charlotte77/p/5629865.html
CS231n课程笔记翻译:反向传播笔记 - 杜客的文章 - 知乎 https://zhuanlan.zhihu.com/p/21407711
前向传递输入信号直至输出产生误差,反向传播误差信息更新权重矩阵。
为什么提出反向传播?因为神经网络中有隐藏层,隐层的误差是不存在的,因此不能直接使用梯度下降算法,而需要先将误差反向传播到隐层,再使用梯度下降算法。
参考:https://www.cnblogs.com/charlotte77/p/5629865.html
CS231n课程笔记翻译:反向传播笔记 - 杜客的文章 - 知乎 https://zhuanlan.zhihu.com/p/21407711