梯度下降理解

最新推荐文章于 2022-04-23 11:41:29 发布

YI__JIA

最新推荐文章于 2022-04-23 11:41:29 发布

阅读量303

点赞数

分类专栏：机器学习文章标签：梯度下降

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yi__jia/article/details/80787904

版权

机器学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

第二天系统学习。

1.设损失函数为J（θ），希望将这个函数最小化，通过梯度下降方法找到最优解。这里应该有些假设，这个函数是凸函数。

以两个参数为例，随机一个点开始，开始下山，对于这个点到最底部，最好的方式就是切线方向，这个方向下降最快，就像图中红色×，每次按照蓝色切线箭头以一定的长度往下走，当走到最低点是停止。对每一个θ求偏导数，合方向为最终方向。

θj = θj - a(J(θ)对每个θj的偏导)

这里的a是learning rate 学习速率，代表了下降的步长，就是每一次下降多么远的距离，这个a的选择需要调整。

2.将梯度下降和线性回归算法结合

对于线性回归算法，在上一个博客中推导了标准方程法，但是这种方法有缺陷，下面用梯度下降推导一下。这里用两个参数为例，对于损失函数J来自于上个博客中的最小二乘法方程，这里多了一个m，对m的解释：如果没有m整个损失函数J将是样本偏差的和，这个和除以m就是平均偏差，这样就和样本数量没有太大关系了。

设定好a之后，不断更新θ的值，直到θ值没有变化，这里可以设置一个很小的数。此时可以认为已经到了最低点，此时的θ为最优解。

3.推广到多元线性回归。

首先设置预测函数h，将X0置为1，把X和θ转为向量，h就可以用向量表示。

后面基本一样，只是多个式子合并为一个。

4.a 学习率的选择

太大太小都不好，太大的话容易越过最低点；太小的话时间太长，每次只能走很小一步所以整体时间会很慢，这个一般来说可以一个一个的试，0.01,0.001,0.0001,0.05等等，如果发现J原来越大说明跳过了最低点，a太大了应该调低，如果J变化很小说明a太小了，应该调大一点。

5.梯度下降方式

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
梯度下降理解

第二天系统学习。 1.设损失函数为J（θ），希望将这个函数最小化，通过梯度下降方法找到最优解。这里应该有些假设，这个函数是凸函数。以两个参数为例，随机一个点开始，开始下山，对于这个点到最底部，最好的方式就是切线方向，这个方向下降最快，就像图中红色×，每次按照蓝色切线箭头以一定的长度往下走，当走到最低点是停止。对每一个θ求偏导数，合方向为最终方向。θj = θj - a(J(θ)对每个θj的偏...
复制链接

扫一扫

专栏目录

YI__JIA CSDN认证博客专家 CSDN认证企业博客

码龄8年

17: 原创

32万+: 周排名

196万+: 总排名

2万+: 访问

: 等级

457: 积分

11: 粉丝

12: 获赞

7: 评论

72: 收藏

私信

关注

热门文章

分类专栏

最新评论

asc18超算relion安装运行2
也太难了吧: 怎么打开relion GUI呀？在哪打开呢
asc18超算relion安装运行2
zzb190854876: DGUI OFF了有什么不良影响吗，一直搞不懂是干什么的，不off又老是报错
未来杯总结2--图像分类预处理图像
C医生: 老师你好，初学者向你请教，上面读取csv的代码，是否还要再加个循环？代码怎么加？直接引用你的代码输出只有csv里的最后一行，而不是全部内容
未来杯总结2--图像分类预处理图像
C医生: 老师你好，这个list.csv的格式是怎样？分2列？1列是图片名称，1列是类别数字把。那这个“图片名称，类别数字”是直接用中文写在csv里吗？怎么对应到您上面写的代码里？
逻辑回归实例
王小懒ws: 能分享一下这个数据集吗？谢谢，没有积分了，下载不了。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。