BP神经网络—反向传播算法

最新推荐文章于 2023-11-25 06:17:49 发布

fairy_zzr

最新推荐文章于 2023-11-25 06:17:49 发布

阅读量531

点赞数

分类专栏：机器学习神经网络 BP神经网络文章标签：神经网络机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ZHANzhenrong/article/details/109030042

版权

机器学习同时被 3 个专栏收录

2 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

为什么要学习反向传播算法？
对于前馈神经网络的参数学习，如果采用交叉熵损失函数，对于样本(x，y)，其损失函数为
在这里插入图片描述

给定训练集D={(x^n,yn)}, N >= n >=0，将每个样本x^{n输入给前馈神经网络，得到网络输出为y}n，其在数据集D上的结构化风险函数为
在这里插入图片描述

其中W和b分别表示网络中所有的权重矩阵和偏置向量， (||W|| F)^2是正则化项，用来防止过拟合，lambda是为正数的超参数，lambda越大，W越接近于0。
有了学习准则和训练样本，网络参数可以通过梯度下降法来进行学习。在梯度下降方法的每次迭代过程中，第l层的参数 W^l 和 b^l 参数更新方式为
在这里插入图片描述

梯度下降法需要计算损失函数对参数的偏导数，如果通过链式法则逐一对每个参数进行求偏导效率比较低。在神经网络的训练中经常使用反向传播算法来高效的计算梯度。我们可以把逻辑回归（Logistic Regression）看做没有隐层的网络；但对于多隐层的神经网络，输出层可以直接求出误差来更新参数，但其中隐层的误差是不存在的，因此不能对它直接应用梯度下降，而是先将误差反向传播至隐层，然后再应用梯度下降。反向传播避免了重复子表达式的指数爆炸。
反向传播算法
（后面的公式会乱，直接截图吧）
在这里插入图片描述

在这里插入图片描述

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
BP神经网络—反向传播算法

为什么要学习反向传播算法？对于前馈神经网络的参数学习，如果采用交叉熵损失函数，对于样本(x，y)，其损失函数为给定训练集D={(xn,yn)}, N >= n >=0，将每个样本xn输入给前馈神经网络，得到网络输出为yn，其在数据集D上的结构化风险函数为其中W和b分别表示网络中所有的权重矩阵和偏置向量， (||W|| F)^2是正则化项，用来防止过拟合，lambda是为正数的超参数，lambda越大，W越接近于0。有了学习准则和训练样本，网络参数可以通过梯度下降法来进行学习。在梯度下
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。