梯度下降算法原理与反向传播思想（推导及核心观点）

最新推荐文章于 2024-03-09 13:49:14 发布

Muyan_Donny

最新推荐文章于 2024-03-09 13:49:14 发布

阅读量6.5k

点赞数 2

分类专栏：神网

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Muyan_Donny/article/details/82146398

版权

神同时被 2 个专栏收录

1 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

梯度下降方法是常用的参数优化方法，经常被用在神经网络中的参数更新过程中。

神经网络中，将样本中的输入X和输出Y当做已知值（对于一个样本[X,Y]，其中X和Y分别是标准的输入值和输出值，X输入到模型中计算得到Y，但是模型中的参数值我们并不知道，所以我们的做法是随机初始化模型的参数，不断更新迭代这些参数，使得模型的输出与Y接近），将连接权和偏置值当做自变量，误差L（损失函数的值）作为因变量。梯度下降的目的是找到全部连接权和偏置值在取何值的情况下误差最小。

经常有人把梯度下降的过程比作从山顶走到谷底，一次走多远比作“学习率”。那么，它的数学表现形式是什么呢？

这就是梯度下降算法的迭代公式，当梯度下降为零时，w、b收敛，训练结束。

反向传播思想可以用来方便的求出损失函数对每个参数的导数，其基本原理是求导数时的链式法则。

其中，Vil表示第l层第i个节点的值，yj(l-1)表示第（l-1）层第几个节点输出的值（也即激活值aj(l-1)）

定义残差为：

则迭代公式根据链式法则可改写为：

这两个公式写的都有点错误，前面两个等号内容是连接权和偏置值迭代的演算；后两个等号内容是损失函数对连接权和偏置值的偏导。

是表示第（l-1）层的第 j 个节点的激活值，即，f（）为该节点的激活函数。

利用残差可以以统一的形式表示各层节点的连接权和偏置值的迭代公式。那么，各层节点处的残差是怎么计算的呢？

这就是反向传播算法设计的内容，反向传播过程的细节如下：

（1）随机初始化网络中各层的参数：连接权和偏置值，通常将它们随机初始化为均值为0、方差为0.01的随机数

（2）对输入数据进行前向计算，从输入层到输出层，依次计算每一层的每个节点的值v以及激活值a

（3）计算最后一层节点的“残差”。对于神经网络的最后一层输出层，因为可以直接算出网络产生的激活值与实际值之间的差距，所以很容易计算损失函数对最后一层的偏导数。假设第K层为输出层，则：

即输出层的第 i 个节点的残差为：（该点的激活值-该点的真实值）*该点激活函数对该点值得导数

（4）对于第K-1层的残差，可以根第K层的残差计算出来：

简而言之：

（多打了一个“=”）

也就是说，前一层某个神经元的残差是由后一层中每个神经元贡献的，其贡献的份额是由二者之间的连接权决定的，并且作用上前一层激活函数的导数。

（5）逐层计算每个节点的残差值，根据（4）中的结果，用 K-2 代替 K-1，用 K-1 代替 K 则得到 K-2 层的残差。以此类推可以得到前面各层的连接权和偏置值得残差。

（6）根据连接权和偏置值的梯度下降法迭代公式即可得到其新的迭代值。

（7）当我们输入一个训练样本室，就可以根据（2）-（6），对W和b进行更新。

关注

2
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
梯度下降算法原理与反向传播思想（推导及核心观点）

梯度下降方法是常用的参数优化方法，经常被用在神经网络中的参数更新过程中。神经网络中，将样本中的输入X和输出Y当做已知值（对于一个样本[X,Y]，其中X和Y分别是标准的输入值和输出值，X输入到模型中计算得到Y，但是模型中的参数值我们并不知道，所以我们的做法是随机初始化模型的参数，不断更新迭代这些参数，使得模型的输出与Y接近），将连接权和偏置值当做自变量，误差L（损失函数的值）作为因变量。梯度下降...
复制链接

扫一扫

专栏目录

Muyan_Donny CSDN认证博客专家 CSDN认证企业博客

码龄6年

33: 原创

20万+: 周排名

66万+: 总排名

11万+: 访问

: 等级

1470: 积分

15: 粉丝

29: 获赞

18: 评论

122: 收藏

私信

关注

热门文章

分类专栏

日记 2篇
神 1篇
网 1篇

最新评论

如何实现css的页面背景图片透明化而不影响文字内容
索奥歌者: 如果是有注释不生效那你说的对。但现在结果是，去注释后css失效，加了就有效，不谈注释对不对，这个情况用你的解释只会得出相反结论的
如何实现css的页面背景图片透明化而不影响文字内容
qq_45936945: 应为那啥css里面注释语句是<-- -->你用//那语句就错了肯定不显示
Linux下安装Tcl
大兵小将: 成功安装了，学习了。
如何实现css的页面背景图片透明化而不影响文字内容
索奥歌者: 顺便，在我分享的这个代码里，由于没有父子级，z-index属性似乎可以注掉
如何实现css的页面背景图片透明化而不影响文字内容
索奥歌者: 不过我最后找到了另一个类似的写法，没有这个问题分享一下代码（我这里是给table表格设置半透明背景，因为表格中有图片，希望背景半透明，好看一点）[code=css] #myTable::before { content: ""; background-image: url("../../images/cldj_bg.jpg"); background-size: 1539px 871px; background-repeat: no-repeat; width: 1539px; height: 871px; position: absolute; top: 0px; left: 0px; opacity: 0.4; z-index: -1; } #myTable { position: relative; width: 1539px; height: 871px; box-shadow: 10px 10px 5px #888; border: 1px solid #666; } [/code] 最终效果可以看看这里：https://soulgazer.gitee.io/tooys-game/web/Genshin_Impact_Tooys/box-record.html

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。