梯度下降算法动图_Deep Learning|神经网络原理学习笔记(5) ：随机梯度下降算法SGD（附手绘图）、离线学习与在线学习...

最新推荐文章于 2022-12-27 23:23:38 发布

琥珀月芽

最新推荐文章于 2022-12-27 23:23:38 发布

阅读量394

点赞数

文章标签：梯度下降算法动图

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_33147807/article/details/111954725

版权

本文介绍了梯度下降算法在神经网络中的应用，通过解析权重和偏置的更新规则来寻找代价函数的最小值。针对大量样本时计算量大的问题，文章提出了随机梯度下降算法，通过随机选取小批量样本来近似整体梯度，从而加速学习过程。此外，还解释了训练中的epoch迭代期以及离线学习与在线学习的区别。

摘要由CSDN通过智能技术生成

快开学了，今天一天都静不下心。不如趁着美好的黄昏来更一篇叭。(写了整整一晚上也是没谁了)

惯例推音乐：今天是一首温柔的迷幻摇滚，我正在摇头晃脑的写

希望听到这首歌的盆友们也能摇头晃脑的看完这篇博客(´^`)

歌手：椅子乐团 The Chairs

歌名：Rollin’ On

❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤分割线

1.真实模型的梯度更新规则

在上一篇里我们说到如何用vvv来代替所有自变量，那么用vvv表示的模型看懂了，我们就可以把男女主角权重www和偏置bbb换上场了。还记得上次的式子吗？

我们将这个式子描述为位置变量vvv的变化，现在将位置变量vjv_{j}vj分解为两个分量，即wkw_{k}wk和blb_{l}bl。

因此梯度向量▽C\bigtriangledown C▽C也就有了相应的分量，即∂C/∂wk\partial C/\partial w_{k}∂C/∂wk和∂C/∂bl\partial C/\partial b_{l}∂C/∂bl。

我们用这些分量，模仿vvv来写wkw_{k}wk和blb_{l}bl的更新规则。

梯度下降算法在神经网络中使用的原理，就是利用算法去寻找能使代价函数CCC取得最小值的权重www和偏置bbb。利用上面的两条更新规则，我们就可以找到让小球沿曲面滚到最低点的路线。也就会找到CCC的最小值。

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
梯度下降算法动图_Deep Learning|神经网络原理学习笔记(5) ：随机梯度下降算法SGD（附手绘图）、离线学习与在线学习...

快开学了，今天一天都静不下心。不如趁着美好的黄昏来更一篇叭。(写了整整一晚上也是没谁了)惯例推音乐：今天是一首温柔的迷幻摇滚，我正在摇头晃脑的写希望听到这首歌的盆友们也能摇头晃脑的看完这篇博客(´^`)歌手：椅子乐团 The Chairs歌名：Rollin’ On❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤❤分割线1.真实模型的梯度更新规则在上一篇里我们说到...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。