2.2.3机器学习—— 判定梯度下降是否收敛 + α学习率的选择

帅翰GG

已于 2024-01-08 10:05:26 修改

阅读量857

点赞数 9

分类专栏：机器学习文章标签：机器学习学习人工智能

于 2024-01-08 10:04:09 首次发布

本文链接：https://blog.csdn.net/weixin_46228946/article/details/135450201

版权

11 篇文章 1 订阅

订阅专栏

2.2.3 判定梯度下降是否收敛 + α学习率的选择

有两种方法，如下图：

在这里插入图片描述

方法一：
- 如图，随着迭代次数的增加，J(W,b)损失函数不断下降
- 当 iterations = 300 之后，下降的就不太明显了 / 基本是一条直线了。这时我们就说，==> “梯度下降已经收敛了”
方法二：
- 设置一个阈值 ε，这里我们让ε = 0.001 （自己设置的，但有的时候也掌握不好这个值是多少）。当J（w,b）下降值 < ε 时，我们就认为他已经收敛了
最后：还是推荐方法一

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

**第一步：**首先选择从 0.0001 0.01 0.1 1 10 依次去尝试，当发现学习率α的值过大时（J（W,b）损失函数发生上弹）。

在这里插入图片描述

第二步：再进行从最后一次正常的α值（出现损失函数J(w,b)上弹之前的值），依次迭代乘3去尝试。然后可以以此类推。最后收敛后，选择最合适的α值。

在这里插入图片描述

关注