机器学习之梯度下降算法

最新推荐文章于 2022-07-03 16:17:44 发布

研学路迢迢

最新推荐文章于 2022-07-03 16:17:44 发布

阅读量175

点赞数 1

本文链接：https://blog.csdn.net/qq_36794290/article/details/104398971

版权

1何为梯度
在微积分里面，对多元函数的参数求∂偏导数，把求得的各个参数的偏导数以向量的形式写出来，就是梯度。比如函数 $f (x, y)$ , 分别对x,y求偏导数，求得的梯度向量就是 $f/∂x, ∂f/∂y)^T$ ,简称 $g r a d f (x, y)$ 或者 $▽ f (x, y)$ 。对于在点(x0,y0)的具体梯度向量就是 $f/∂x0, ∂f/∂y0)^T$ .或者 $▽ f (x 0, y 0)$ ，如果是3个参数的向量梯度，就是 $f/∂x, ∂f/∂y，∂f/∂z)^T$ ,以此类推。
2.梯度下降的相关概念

步长（Learning rate）：步长决定了在梯度下降迭代的过程中，每一步沿梯度负方向前进的长度。用上面下山的例子，步长就是在当前这一步所在位置沿着最陡峭最易下山的位置走的那一步的长度。
特征（feature）：指的是样本中输入部分，比如2个单特征的样本（ $x_0,y_0$ ）,（ $x_1,y_1$ ）（ $x_0,y_0$ ),( $x_1,y_1$ ）则第一个样本特征为 $x_0$ ，第一个样本输出为 $y_0$ 。
假设函数（hypothesis function）：在监督学习中，为了拟合输入样本，而使用的假设函数，记为hθ(x)hθ(x)。比如对于单个特征的m个样本（ $x_i，y_i$ ）( $i = 1, 2, . . . m$ )（ $x_i，y_i$ ） $(i = 1, 2, . . . m)$ ,可以采用拟合函数如下： $h_θ(x)=θ_0+θ_1x$
损失函数（loss function）：为了评估模型拟合的好坏，通常用损失函数来度量拟合的程度。损失函数极小化，意味着拟合程度最好，对应的模型参数即为最优参数。在线性回归中，损失函数通常为样本输出和假设函数的差取平方。比如对于m个样本（ $x_i,y_i$ ） $(i = 1, 2, . . . m)$ （ $x_i,y_i$ ）( $i = 1, 2, . . . m$ ),采用线性回归，损失函数为： $J(θ_0,θ_1)=\sum_{i=1}^m{(h_θ(x_i)−y_i)}^2$

其中 $x_i$ 表示第 $i$ 个样本特征， $y_i$ 表示第 $i$ 个样本对应的输出， $h_θ(xi)$ 为假设函数。

简单举例实现梯度下降（ $J_{(w)}=w^2+2w+1$ ）

 def  J(w):
        return w**2+2*w+1
J(1)
 def  G(w):
        return 2*w+2
G(1)
 epoch = 10
 alpha = 0.1
 w = 1
 epoch = 10
    a =  0.1
    w = 1
    for i in range (epoch):
        w =  w-a*G(w)
        print (w）

计算结果：

在这里插入图片描述
迭代次数越多就会越接近最小值

研学路迢迢

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习之梯度下降算法

1何为梯度在微积分里面，对多元函数的参数求∂偏导数，把求得的各个参数的偏导数以向量的形式写出来，就是梯度。比如函数f(x,y), 分别对x,y求偏导数，求得的梯度向量就是(∂f/∂x, ∂f/∂y)T,简称grad f(x,y)或者▽f(x,y)。对于在点(x0,y0)的具体梯度向量就是(∂f/∂x0, ∂f/∂y0)T.或者▽f(x0,y0)，如果是3个参数的向量梯度，就是(∂f/∂x, ∂f...
复制链接

扫一扫