梯度下降(批量梯度下降)

最新推荐文章于 2024-08-15 17:21:12 发布

会飞的猩猩。

最新推荐文章于 2024-08-15 17:21:12 发布

阅读量1.9k

点赞数 1

分类专栏：机器学习文章标签：梯度下降

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zx1245773445/article/details/82902841

版权

机器学习专栏收录该内容

34 篇文章 3 订阅

订阅专栏

随机梯度下降

梯度下降是机器学习常用的优化方法之一，用来求解无约束目标函数(损失函数)的极值。但是它收敛到的是局部最小值，当函数是凸函数时，可以收敛到全局最小值。当我们在模型中运用梯度下降法求解时，其实就是求解在该模型损失函数取得最小值时所对用的模型参数值是多少。当然梯度下降也可以单纯的用来求解一个函数的极值。

梯度是函数值上升变化最快的方向，可以求得函数的最大值；所以负梯度就是函数值下降变化最快的方向，可以求得函数的最小值。因为梯度指引的只是一个方向，具体要变化多少就需要步长，也就是学习率。下面是梯度下降算法的描述：

数据集为D = {(x1, y1), (x2, y2),......, (xm, ym)}, $J(\theta)$ 为损失函数, θ(一个向量)为模型需要求解的参数。

初始化参数：模型需要求得的参数

迭代更新参数, 其中 i 为参数的分量，alpha为学习率， $J(\theta)$ 为所有样本的损失：

Repeat：

$\theta _i=\theta_i-\alpha\frac{\partial }{\partial \theta _i}J(\theta ), for(i=1,2,3,...,n)$

当损失函数的值小于一个阈值时，就停止迭代。

下面解释一下为什么梯度下降能收敛到局部最小值或全局最小值，这里用只有一个变量的线性回归损失函数来举例解释：

假如θ1初始化的地方如下图所示，在函数的右边。这时梯度的大小为正数，所以θ1减去一个正数就会减小，往中间移动。

假如θ1初始化的地方如下图所示，在函数的左边。这时梯度的大小为负数，所以θ1减去一个负数就会增加，也往中间移动。

所以最终都会往中间最小值的地方移动。

其次讲一下为什么学习率为固定值，依然能够收敛到局部最小值或全局最小值：

这是因为损失函数的导数在变。如上图所示，在往中间收敛的时候，损失函数的导数也是在不断减小的，所以参数的变化程度会越来越小，就感觉像步长变小了。

在这里举一个简单的线性回归，利用梯度下降求解模型参数的?：

线性回归的假设函数为, 其中θ0和θ1就是模型的参数；：

损失函数为：

初始化θ0 ，θ1= 0；

将所有的样本带入到损失函数中，然后分别对θ0和θ1求导，并同时更新θ0和θ1：

直到 $J(\theta)$ 的值小于一个阈值，则停止迭代；

在搜索极值的过程中，学习率大小的选择很重要。

学习率太小，函数值下降收敛的速度就很慢，因为每次走的步长很小；

学习率太大，收敛的过程就会出现震荡，还有可能最终不能收敛。

下面是调整学习率的一个方法：

可以选择一系列的学习率，然后画出每个学习率 $J(\theta)$ 和迭代次数的关系图。这个关系图也可以检查梯度下降是否正常运行，因为 $J(\theta)$ 应该在每一次迭代都有减小。

参考链接吴恩达的视屏：https://study.163.com/course/courseMain.htm?courseId=1004570029

会飞的猩猩。

关注

1
点赞
踩
11

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

会飞的猩猩。 CSDN认证博客专家 CSDN认证企业博客

码龄12年

83: 原创

3万+: 周排名

140万+: 总排名

121万+: 访问

: 等级

5849: 积分

136: 粉丝

559: 获赞

127: 评论

2259: 收藏

私信

关注

分类专栏

数据分析 2篇
DataFrame 14篇
免费课程 4篇
Excel 7篇
数据结构 5篇
MySQL 4篇
Python 44篇
爬虫 7篇
机器学习 34篇
Ubuntu 1篇
Hadoop 1篇

最新评论

【Excel】数据透视表—标签合并居中
会飞的猩猩。: 试试万能的重启大法
【Excel】数据透视表—标签合并居中
艰难的进程: 我一点工作簿会自动关闭是怎么回事
在mac上，将csv文件导入MySQL，ERROR 1290 (HY000)，ERROR 13 (HY000)
会飞的猩猩。: init_connect里面
在mac上，将csv文件导入MySQL，ERROR 1290 (HY000)，ERROR 13 (HY000)
Gloria_Jiang_: "复制文件内容然后保存为my.cnf文件，再把secure-file-priv = ’‘添加进去。" 礼貌问一下这句是什么意思，复制这些语句粘贴到哪里保存？添加进去是指添加到哪里
metrics.roc_curve()输出的tpr或fpr的结果为nan
辰%: 请问你这么解决的啊

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。