反向传播算法对于快速训练大型神经网络至关重要。本文将介绍算法的工作原理。
目录
1.简单的神经网络
2.激活函数
3.错误函数
4.正向传播
4.1 更新隐藏层
5.反向传播
5.1 求导数
5.2 其他导数
5.3 反向传播误差倒数
6.参考文献
1.简单的神经网络
如图 1 所示,展示了一个神经网络,其中包含一个输入节点、一个输出节点以及两个隐藏层(分别有两个节点)。相邻层中的节点使用权重
(网络参数)连接。
![](https://i-blog.csdnimg.cn/blog_migrate/64958c3f4f812b24447e9cde2981558a.png)
图 1 神经网络示意图
2.激活函数
如图 2 所示,每个节点都有一个总输入
、一个激活函数
和一个输出
。
必须是非线性函数,否则神经网络将只能学习线性模型(相关内容在【