梯度下降

最新推荐文章于 2023-03-30 22:24:29 发布

就叫温华啦

最新推荐文章于 2023-03-30 22:24:29 发布

阅读量151

点赞数

分类专栏：机器学习算法的直觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/a3765421/article/details/86652150

版权

机器学习算法的直觉专栏收录该内容

13 篇文章 0 订阅

订阅专栏

什么是梯度下降呢？

梯度下降是一种参数优化的方法，他的使用对象是一个函数，如果函数是凸的，且不考虑计算资源的耗费，是可以得到最优解的。如果函数非凸，则要多次随机初始化参数，防止陷入局部最优解。

除了梯度下降，还有什么找函数最优解的方法吗？

1.最小二乘法 -> 获得解析解。这种方法在数据集比较小的时候用，当数据集大的时候用其他的方法，因为数据集大的时候对矩阵求逆耗费时间。

2.牛顿法 : 少数几次迭代就能得到不错的解，但是一次迭代时所花时间较多。因为要对海森矩阵求逆要花很多时间。

3.拟牛顿法：与牛顿法的不同（不能求得矩阵的逆，因此求伪逆）

如何使用梯度下降法呢？

首先，要有优化目标：在机器学习中，我们常说的优化目标称之为损失函数。

其次，对损失函数求导，要用到微积分的知识。

最后，更新参数，这里套用了一个固定的公式。

这是梯度下降的简单形式，直观上明白梯度下降是在做什么：

这是一般的梯度下降公式的推导：

这是矩阵形式的推导，看起来较为简洁：

就叫温华啦

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
梯度下降

什么是梯度下降呢？梯度下降是一种参数优化的方法，他的使用对象是一个函数，如果函数是凸的，且不考虑计算资源的耗费，是可以得到最优解的。如果函数非凸，则要多次随机初始化参数，防止陷入局部最优解。除了梯度下降，还有什么找函数最优解的方法吗？1.最小二乘法 -> 获得解析解。这种方法在数据集比较小的时候用，当数据集大的时候用其他的方法，因为数据集大的时候对矩阵求逆耗费时间。...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。