【梯度算法学习笔记】

qun\

已于 2023-06-10 14:11:20 修改

阅读量85

点赞数

文章标签： python 开发语言

于 2023-06-10 11:09:25 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiaosaoqun/article/details/131139279

版权

梯度下降算法的直观感受

已知梯度下降算法公式为：

式中，J(θ)为损失函数；α为学习率。关于损失函数的介绍，追梦Hocking讲解的极为详细，我学习了大佬的讲解，记录一下我对梯度下降算法的简单理解。主要解释为什么用θ 减去损失函数对θ 的偏导。

为了简化笔记，直接采用吴恩达课程中的笔记，梯度下降算法为：

根据上述公式，已知J(w) 是w 的函数，因此我们可以绘制坐标轴：
在这里插入图片描述
式中，∂J(w)/∂w 为求w点出的斜率，当如图所示，∂J(w)/∂w>0，又因为α始终>0，则w=w-∂J(w)/∂w，w的值向左移动，当给α赋值时，w被不断更新，不断向左移动，直到找到w最小值。当w取值对称轴左边时，同理。并由此拓展到多维度的求解形式。
这就是为什么梯度下降算法形式为：
在这里插入图片描述

一开始被梯度下降算法的表达形式困扰了挺久，因此记录下来，弥补自己绕不过弯的愚蠢。。。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【梯度算法学习笔记】

式中，∂J(w)/∂w 为求w点出的斜率，当如图所示，∂J(w)/∂w>0，又因为α始终>0，则w=w-∂J(w)/∂w，w的值向左移动，当给α赋值时，w被不断更新，不断向左移动，直到找到w最小值。当w取值对称轴左边时，同理。讲解的极为详细，我学习了该大佬的讲解，记录一下我对梯度下降算法的简单理解。主要解释为什么是θ 减去损失函数对θ 的偏导。一开始被梯度下降算法的表达形式困扰了挺久，因此记录下来，弥补自己绕不过弯的愚蠢。式中，J(θ)为损失函数；关于损失函数的介绍，
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。