梯度下降算法的实质

最新推荐文章于 2022-02-27 11:39:48 发布

罗泽

最新推荐文章于 2022-02-27 11:39:48 发布

阅读量1k

点赞数

分类专栏：机器学习神经网络文章标签：梯度下降机器学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013698770/article/details/52883337

版权

机器学习同时被 2 个专栏收录

8 篇文章 0 订阅

订阅专栏

5 篇文章 0 订阅

订阅专栏

　　梯度下降算法的做法是通过改变权重w的值，从而使代价函数最小。那么问题是，为什么改变w的值能够使代价函数最小呢？最直接的方式应该是求取代价函数C对于w的导数，当∂C⁄∂w = 0时，代价函数Ｃ才具有最小值，此时通过∂C⁄∂w = 0计算出来的值才是最优权重。但是，由于计算复杂度的原因，我们采取的是一种间接的思路：梯度下降算法。
　　实际上，由于最终的目的是让C值变小。既然通过求导的方式达不到目的，那就看有没有方式能够让C逐步变小。而梯度下降的方式，就是沿着C值下降最快的方向来减小C的值。
　　C值下降最快的方向即为C值的梯度方向∇C。梯度可以理解为某点的斜率：
∇C= ∂C⁄∂w
　　沿着梯度方向下降一定的距离∆w，这就是下降的梯度值∆C：
∆C=∇C×∆w
　　最后，更新梯度值
C = C-∆C=C- ∂C/∂w×∆w
　　通过以上步骤也能实现梯度的下降。重要的是，通过操纵∆w能够控制C下降的幅度。这就是我们能够通知Ｃ的值进行调参的关键。
　　但是又如何能保证∆C一定是正数呢？否者就不能保证每一步都是朝着减小C的方向。∆C= ∂C/∂w×∆w，∂C/∂w无法控制，但∆w能控制，那么？是否可以通过控制∆w使两者乘积一定为正值呢？答案是可以的，某个数的平方就一定为正。
　　因此，∆w= η× ∂C/∂w，其中的η是学习率，用于控制下降的速度。
　　即w = w - η× ∂C/∂w，这就通过改变权重w的值，实现了C值的下降。

http://www.tensorfly.cn/home/?p=80

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

罗泽 CSDN认证博客专家 CSDN认证企业博客

码龄11年

128: 原创

9万+: 周排名

167万+: 总排名

88万+: 访问

: 等级

7740: 积分

396: 粉丝

357: 获赞

93: 评论

994: 收藏

私信

关注

热门文章

分类专栏

笔记 1篇
opencv 1篇
机器学习 8篇
图像处理 5篇
C++ 2篇
学习心得
Halcon 22篇
C#入门 7篇
相机镜头和光源 10篇
认知 2篇
神经网络 5篇
相机软件 1篇
AOI软件框架 9篇
产品 1篇
工作方法
运动控制 1篇
Python 10篇
Linux入门 9篇
TensorFlow 4篇
Object Detection 5篇
caffe 13篇
markdown
matlab 6篇
Qt 4篇
PersonReID 8篇

最新评论

Halcon中的图像相减算子abs_diff_image和sub_image
入门到卸载: 你试试不就知道了能耽误你几分钟
Halcon中的图像相减算子abs_diff_image和sub_image
m0_73037592: 如果两张图像的尺寸不一样能进行加减吗？
Halcon中 reduce_domain算子和crop_domain算子的使用及配合
懂技术的pm: 寥寥几句话却说得很明白。
Halcon中count_obj算子及其异常分析
freekun: *异常第一种情况我没有解决，博主帮忙看一下问题在哪里，感谢 *如下没有交集的区域求交集后count_obj 计算结果为1 *union1合并后count_obj 计算结果为1 *再connection打散后count_obj 计算结果为1 *有什么办法能去掉这个空使count_obj结果为0吗 gen_rectangle1 (Rectangle, 30, 20, 100, 200) gen_rectangle1 (Rectangle1, 330, 20, 400, 200) intersection (Rectangle, Rectangle1, RegionIntersection) count_obj (RegionIntersection, Number1) union1 (RegionIntersection, RegionUnion) count_obj (RegionUnion, Number2) connection (RegionUnion, ConnectedRegions) count_obj (ConnectedRegions, Number3)
Matlab笔记：将列向量直接赋值给行向量
NEWEVA__zzera22: 原来我的更新后的theta_ls K*1真的可以赋值给theta(pos_array)

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。