机器学习-吴恩达梯度下降（笔记）

稀奇_

已于 2023-03-18 12:22:52 修改

阅读量1.3k

点赞数 1

分类专栏：机器学习文章标签：机器学习 python 回归

于 2022-07-03 16:17:44 首次发布

本文链接：https://blog.csdn.net/zxq1_/article/details/125582426

版权

机器学习专栏收录该内容

6 篇文章 4 订阅

订阅专栏

文章目录

什么是梯度下降？

梯度下降是寻找目标函数最小化的方法。

比如在上一个单变量线性回归模型文章中我们的目标是得到最拟合的单变量线性回归Function，也就是得到代价函数的最小值：min J(w,b) 。
那么如何得到呢？梯度下降法就可以通过不断迭代调整参数来寻找最合适的值。

梯度下降表达式

我们还是用单变量线性回归模型中的J(w,b)来举例：
在这里插入图片描述
我们持续不断地更新w和b，直到他们收敛，也就是计算后他们的值已经不会出现什么变动，那么我们就得到了局部（以下文章会解释为什么是局部）/ 全局最小值（只是收敛到极小值，而不是真正意义上的最小值。以下说的最小值，其实都是极小值）或是鞍点。

注意我们需要同步更新w和b，也就是w更新后，b更新时用的还是没有更新的w。

表达式解释

这里的等号是一个赋值符号，而不是数学意义上的相等符号。
这里的Alpha是学习率（learning rate），用来控制步长，也就是我们每一步的跨度，一定大于0，通常在0到1之间，在之后的文章中会详细讲解。
这里的最后一项是对于代价函数J(w,b)的偏导，用来控制方向。

梯度下降的直观理解

为了更直观的观察梯度下降是如何让目标函数的最小化，我们假设只有一个参数的代价函数 J(w)，在上一章中我们知道J(w)是一个二次函数（quadratic function），也就是一个抛物线。
J(w)图像
我们假设一个在抛物线上的初始点
在这里插入图片描述
现在开始进行梯度下降：
这里的最后一项（对J(w)的求导）在图中就是这个点的斜率：

那么也就是w = w - $\alpha$ * 一个正数，由于alpha一定是正数，所以w减小了所以在图中的表现就是点向左移动，也就是向最小值靠近：
在这里插入图片描述
再来看另一个例子，当我们取的点在抛物线左边：
那么这个时候J(w)的求导就是负数，也就是一个负的斜率：

那么现在w = w - $\alpha$ * 一个负数，w增大了，所以在图中的表现就是点向右移动，也在向最小值靠近：
在这里插入图片描述