吴恩达机器学习视频总结day6

最新推荐文章于 2023-01-19 20:24:40 发布

harkbox

最新推荐文章于 2023-01-19 20:24:40 发布

阅读量105

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43702629/article/details/96451985

版权

机器学习专栏收录该内容

7 篇文章 0 订阅

订阅专栏

梯度下降

我们现在的目的是让代价函数J达到最小，那么梯度下降就是计算函数

最小值的一种方法。

梯度下降的思想是：我们先随机找一个参数组合，注意是假设函数中的参数，

我们前面所说有2个，但不总是两个，寻找到初始值后，我们寻找下一个让代价

函数下降最多的参数，然后一直寻找，直到找到一个局部最小值，我们如果尝试不同

的参数初始值，那么我们可能会得到不同的局部最小值。

我们可以这样思考一下，假设我们现在在一座山上，我们随机选择一个方向

然后开始下山，如果我们把下山的步子量化，也就是说我们迈的步子的大小

有多大，不可否认的是，只有你的视力不错，你应该总会下降的山中的局部最低。

我们下降了很多次，我们不是一次就到最低处的，所以我们把这种算法称为

批量梯度下降算法

公式如下

其中的a是学习率。

直观的将就是决定你步子迈多大的量。关于上面的偏导数项我这里不会提及。

不过我有一种理解方法，你可以类别物理里的速度与加速度然后思考一下，

或许会有不同的想法。

最后一点：我们更新theta0和theta1时，必须使用未更新前的值，例如你的theta

0已经更新了,那么我们使用theta0未更新前的值，这样保证实现了同步更新。

梯度下降的理解

对于梯度下降的理解，主要的一点是这个偏导数项，视频中吴老师使用了

一个参数进行了演示，这里我不在多说。即便对于多项而言，偏导数达到局部最小值

时的值也会是0，不过对于多元函数而言，贡献这个函数的并不是只有一个变量，而是很

多个，我的意思是说一个未知量停止更新时，其余的未知量也还会更新。

我的理解可能存在错误，如果发现错误我会第一时间回来改正，接下来我将使用

matlab去实现这一算法，并且我们还会学习到泛化的梯度下降算法，并且会有

更多挑战。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
吴恩达机器学习视频总结day6

梯度下降我们现在的目的是让代价函数J达到最小，那么梯度下降就是计算函数最小值的一种方法。梯度下降的思想是：我们先随机找一个参数组合，注意是假设函数中的参数，我们前面所说有2个，但不总是两个，寻找到初始值后，我们寻找下一个让代价函数下降最多的参数，然后一直寻找，直到找到一个局部最小值，我们如果尝试不同的参数初始值，那么我们可能会得到不同的局部最小值。我们可以这样思考一下，...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。