梯度下降（Gradient Descent）总结

最新推荐文章于 2023-08-17 13:53:32 发布

下木南

最新推荐文章于 2023-08-17 13:53:32 发布

阅读量472

点赞数

分类专栏： DL 文章标签：梯度下降

本文链接：https://blog.csdn.net/xn761388760/article/details/100125281

版权

DL 专栏收录该内容

0 篇文章 0 订阅

订阅专栏

1. 梯度

在微积分中，梯度的概念是：对多元函数的参数求∂偏导数，把求得的各个参数的偏导数以向量的形式写出来。比如函数f(x,y), 分别对x,y 求偏导数，求得的梯度向量就是(∂f/∂x, ∂f/∂y)T，简称grad f(x,y)或者▽f(x,y)。对于在点（x0,y0) 的具体梯度向量就是(∂f/∂x0, ∂f/∂y0)T.或者▽f(x0,y0)，如果包含3个参数的向量梯度，就是(∂f/∂x, ∂f/∂y，∂f/∂z)T,以此类推。

那么这个梯度向量求出来之后具有什么意义呢？从几何上来看，就是梯度表示了函数变化最快的方向。具体来说，对于函数f(x,y)，在点(x0,y0)，沿着梯度向量的方向就是∂f/∂x0, ∂f/∂y0)T的方向是f(x,y)增加最快的地方，或者说，沿着梯度向量的方向，更加容易找到函数的最大值，相反沿着梯度相反的方向也就更加容易找到函数的最小值。