机器学习（三）：梯度下降法

最新推荐文章于 2021-02-05 21:55:23 发布

芙兰泣露

最新推荐文章于 2021-02-05 21:55:23 发布

阅读量7.1k

点赞数

分类专栏：机器学习与算法文章标签：机器学习

机器学习与算法专栏收录该内容

16 篇文章 3 订阅

订阅专栏

本博客大部分参考了这篇博文

梯度

在微积分里面，对多元函数的参数求∂偏导数，把求得的各个参数的偏导数以向量的形式写出来，就是梯度。

比如函数 $f(x,y)$ , 分别对x,y求偏导数，求得的梯度向量就是 $(∂f/∂x, ∂f/∂y)$ ,简称 $grad f(x,y)$ 或者 $\nabla f(x,y)$ 。如果是3个参数的向量梯度，就是 $(∂f/∂x, ∂f/∂y，∂f/∂z)$ ,以此类推。

那么这个梯度向量求出来有什么意义呢？他的意义从几何意义上讲，就是函数变化增加最快的地方。

具体来说，对于函数 $f(x,y),在点(x_0,y_0)$ ，沿着梯度向量的方向(即 $(∂f/∂x_0, ∂f/∂y_0)$ 的方向)是 $f(x,y)$ 增加最快的地方。或者说，沿着梯度向量的方向，更加容易找到函数的最大值。反过来说，沿着梯度向量相反的方向，也就是 $-(∂f/∂x_0, ∂f/∂y_0)$ 的方向，梯度减少最快，也就是更加容易找到函数的最小值。

矩阵描述

参考的博客给出了详细的解答过程，这里就另外给个矩阵的求导法则链接

补充：改进的随机梯度下降

上述博客讲了随机梯度下降，在此补充一个循环迭代的随机梯度下降。
即通过多次循环随机梯度下降，来避免随机梯度下降的局部最优。
建议参考《机器学习实战》的5.2.4节。

补充：牛顿法

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习（三）：梯度下降法

本博客大部分参考了这篇博文梯度在微积分里面，对多元函数的参数求∂偏导数，把求得的各个参数的偏导数以向量的形式写出来，就是梯度。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。