梯度

最新推荐文章于 2023-12-07 22:14:39 发布

语亦情非

最新推荐文章于 2023-12-07 22:14:39 发布

阅读量2k

点赞数

分类专栏：深度学习

本文链接：https://blog.csdn.net/a1272899331/article/details/106272053

版权

深度学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

梯度

简单来说，例如有 y=f(x0,x1)

像这样的全部由变量的偏导数组成的向量称为梯度（gradient）。

实际上，梯度会指向各点处的函数值降低的方向。更严格的讲，梯度指示的方向是各点处的函数值减少最多的方向。

为什么这么说，因为方向导数=cos()×梯度，而是方向导数的方向和梯度方向的夹角。所以，所有的下降方向中，梯度方向下降的最多。

梯度法

神经网络的主要任务是在学习时找到最优的参数（权重和偏置），这个最优参数也就是损失函数最小时的参数。但是，一般情况下，损失函数比较复杂，参数也很多，无法确定在哪里取得最小值。所以通过梯度来寻找最小值（或者尽可能小的值）的方法就是梯度法。

需要注意的是，梯度表示的是各点处的函数值减少最多的方向，所以梯度的方向并不一定指向最小值。但是沿着它的方向能够最大限度地减少函数的值。因此，在寻找函数的最小值（或者尽可能小的值）的位置的时候，要以梯度的信息为线索，决定前进的方向。

此时梯度法就派上用场了。在梯度法中，函数的取值从当前位置沿着梯度方向前进一定距离，然后在新的方向重新求梯度，再沿着新梯度方向前进，如此反复。

像这样，通过不断地沿梯度方向前进，逐渐减小函数值的过程就是梯度法（gradient mothod）。一般来说，神经网络（深度学习）中，梯度法主要是指梯度下降法（gradient descent mothod）。

现在，我们试着用数学公式表达梯度下降（两个变量情况下）：

，

其中，表示更新量，在神经网络的学习中，称为学习率（learning rate）。学习率决定在一次学习中，应该学习多少，以及在多大程度上更新参数。

学习率需要事先设定为某个值，比如0.01或0.001。一般而言，这个值过大或过小，都无法抵达一个“好的位置”。在神经网络的学习中，一般会一边改变学习率的值，一边确认学习是否正确进行。

下面，我们用Python来实现梯度下降法。

def gradient_descent(f, init_x, lr=0.01, epoch=100):
    x = init_x
    for i in range(epoch):
        grad = numerical_gradient(f, x) # 求导函数
        x -= lr * grad
 

# 用定义法求导数
def numerical_gradient(f, x):
    h = 1e-4
    grad = np.zeros_like(x)
 
    for idx in range(x.size):
        temp = x[idx]
        # 计算f(x+h)
        x[idx] = temp + h
        fxh1 = f(x)
 
        # 计算f(x-h)
        x[idx] = temp - h
        fxh2 = f(x)
 
        grad[idx] = (fxh1 - fxh2)/(2 * h)
        x[idx] = temp
 
    return grad

eg：用梯度法求的最小值：

def function(x):
    return x[0]**2 + x[1]**2
 
inin_x = np.array([-3.0, 4.0])
 
print(gradient_descent(function, inin_x, lr=0.1, epoch=100))

参考：https://blog.csdn.net/Answer3664/article/details/91346838

语亦情非

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
梯度

梯度简单来说，例如有 y=f(x0,x1)像这样的全部由变量的偏导数组成的向量称为梯度（gradient）。实际上，梯度会指向各点处的函数值降低的方向。更严格的讲，梯度指示的方向是各点处的函数值减少最多的方向。为什么这么说，因为方向导数=cos()×梯度，而是方向导数的方向和梯度方向的夹角。所以，所有的下降方向中，梯度方向下降的最多。梯度法神经网络的主要任务是在学习时找到最优的参数（权重和偏置），这个最优参数也就是损失函数最小时的参数。但是，一般情况下，损失函数比较复杂，...
复制链接

扫一扫

专栏目录