神经网络参数的反向传播算法

最新推荐文章于 2024-08-05 11:15:19 发布

林头头03

最新推荐文章于 2024-08-05 11:15:19 发布

阅读量3.5k

点赞数

分类专栏：机器学习机器学习基础

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_29373285/article/details/82464568

版权

这篇博客深入介绍了神经网络的反向传播算法，用于计算代价函数关于所有参数的导数。内容包括神经网络的代价函数、反向传播的过程、参数展开、梯度检验以及随机初始化的重要性。通过对神经网络的训练步骤的总结，强调了反向传播在神经网络学习中的关键作用。

摘要由CSDN通过智能技术生成

神经网络

假设神经网络的训练样本有m个，每个包含一组输入x和一组输出信号y，L表示神经网络层数，SI表示每层的neuron个数(Sl表示输出层神经元个数)，SL代表最后一层中处理单元的个数。

将神经网络的分类定义为两种情况：二类分类和多类分类，

二类分类：SL=0,y=0or1表示哪一类；

K类分类：SL=k,yi=1 表示分到第i类；(k>2)

我们回顾逻辑回归问题中我们的代价函数为：

在逻辑回归中，我们只有一个输出变量，又称标量（scalar），也只有一个因变量yy，但是在神经网络中，我们可以有很多输出变量，我们的 hθ(x)是一个维度为K的向量，并且我们训练集中的因变量也是同样维度的一个向量，因此我们的代价函数会比逻辑回归更加复杂一些，

**神经网络代价函数为：

这个看起来复杂很多的代价函数背后的思想还是一样的，我们希望通过代价函数来观察算法预测的结果与真实情况的误差有多大，唯一不同的是，对于每一行特征，我们都会给出KK个预测，基本上我们可以利用循环，对每一行特征都预测KK个不同结果，然后在利用循环在KK个预测中选择可能性最高的一个，将其与yy中的实际数据进行比较。

正则化的那一项只是排除了每一层θ0后，每一层的θ 矩阵的和。最里层的循环j循环所有的行（由sl +1 层的激活单元数决定），循环i则循环所有的列，由该层（sl层）的激活单元数所决定。即：hθ(x)与真实值之间的距离为每个样本-每个类输出的加和，对参数进行regularization的bias项处理所有参数的平方和。

9.2 反向传播算法

之前我们在计算神经网络预测结果的时候我们采用了一种正向传播方法，我们从第一层开始正向一层一层进行

最低0.47元/天解锁文章

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

林头头03 CSDN认证博客专家 CSDN认证企业博客

码龄9年

151: 原创

3万+: 周排名

2万+: 总排名

146万+: 访问

: 等级

7354: 积分

697: 粉丝

1102: 获赞

124: 评论

5136: 收藏

私信

关注

分类专栏

最新评论

Arduino串口通信(Serial)
私欲_: 感谢博主，学到很多
计算机网络面试总结 -- TCP
你奥利奥化了: 保姆级讲解没人看嘛
Centos升级gcc版本实测可用
hello姣姣: $ yum groupinstall "Development Tools" $ yum install glibc-static libstdc++-static 您好，我在安装上面的开发工具时显示 You need to be root to perform this command. 我是在服务器上装的，本身不是root用户，这种情况该怎么办？
WIFI 2.4G及5G信道一览表
筑基大能: 博主会更新802.11ax部分的内容吗
Arduino串口通信(Serial)
m0_54040622: 讲的太好啦，底层逻辑讲的哼清楚，之前学Arduino都没接触到这些，只是会用就可以了，不愧是阿里的大佬

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。