从0开始学pytorch【1】--线性函数的梯度下降

高山莫衣

已于 2023-03-11 22:18:22 修改

阅读量463

点赞数 2

分类专栏： python_算法学习 pytorch 文章标签： pytorch python 机器学习

于 2023-03-11 21:00:01 首次发布

原创作品，共同进步！

本文链接：https://blog.csdn.net/AdamCY888/article/details/129466396

版权

pytorch 同时被 2 个专栏收录

60 篇文章 3 订阅

订阅专栏

python_算法学习

26 篇文章 3 订阅

订阅专栏

从0开始学pytorch【1】--线性函数的梯度下降演示

故事背景
生成数据
损失函数
梯度更新1次
迭代
主函数
执行

故事背景

在正式学习pytorch深度框架之前，假设你已经掌握了机器学习、深度学习的梯度下降算法基础理论，但是编程技术还不够熟练，于是本文将使用python演示如何利用梯度下降法求解一元线性回归中的参数。对于复杂的目标函数，无法求出显式解以及高维目标函数无法可视化。在知道样本数据下，于是通过梯度下降算法求解最优解（可能是局部最优解）。

$y = w * x + b$

其中的 $w$ 和 $b$ 就是我们要求解的参数。

生成数据

假设500个样本来源于:
$y = 5 * x + 3$
并且受到其他因素影响，这里设置标准高斯噪声，则生成样本数据：
$y = 5 * x + 3 + N (0, 1)$

import numpy as np

def function(b=3,size=500):
    x = np.random.uniform(1, 30, size)
    noise = np.random.normal(0, 1, size)
    y = 5 * x + b + noise
    list_1 = []
    for i, j in zip(x, y):
        list_1.append([i, j])
    return list_1

损失函数

设置损失函数为均方误差MSE：

$\mathrm{MSE}=\frac{1}{n} \sum_{i=1}^n\left(Y_i-\hat{Y}_i\right)^2 \\ \hat{Y_i} = \hat{w}*x_i+\hat{b}$

梯度更新1次

梯度更新方法,lr为学习率：
$w_{i+1} = w_i - lr *\frac{\partial MSE}{\partial w}$

$b_{i+1} = b_i - lr * \frac{\partial MSE}{\partial b}$

# 梯度更新1次
def grad_step(c_w, c_b, lr, points):
    total_w_g,  total_b_g = 0, 0
    N = len(points)
    for point in points:
        x, y  = point[0], point[1]
        total_w_g += 2 * (y- (c_w * x + c_b) ) * (-x) / N
        total_b_g += 2 * (y- (c_w * x + c_b)) *(-1) / N
    c_w = c_w - lr * total_w_g
    c_b = c_b - lr * total_b_g
    return [c_w, c_b]

迭代

在整个数据集上面循环time次，这里没有设置batch，即将整个样本理解为1个batch。

# 迭代
def diedai(i_w, i_b, lr, points,time):
    n_w, n_b = i_w, i_b
    for i in range(time):
        n_w, n_b = grad_step(n_w, n_b, lr, points)
    print('参数：', n_w, n_b )
    return [n_w, n_b]

主函数

可以对比看迭代前后的损失，设置初始参数，并输出迭代后的参数估计值。

# 主函数

def main(i_w, i_b, lr, points, time):
    loss_i = copute_erro(i_w, i_b, points)
    print(f"初始状态损失：{loss_i}")
    
    ii_w, ii_b = diedai(i_w, i_b, lr, points, time)
    loss_e = copute_erro(ii_w, ii_b, points)
    print(f"结束状态损失：{loss_e}")

执行

设置初始参数均为0，学习率为0.0001，迭代40000次，最后输出结果。

# 执行
if __name__ == "__main__":
    o_w = 0
    o_b = 0
    lr = 0.0001
    time = 40000
    
    points = function()

    main(o_w, o_b, lr, points, time)
'''
输出结果：
初始状态损失：8168.732799656018
参数： 5.0154640678882005 2.771481630325438
结束状态损失：1.0200946795304344
'''

参数估计值 $w$ , $b$ 分别为5.015464和2.77148，这总体设置的5和3很接近。前提是我们并不知道参数真实值为5和3，于是就用参数估计值5.015464和2.77148去替代总体参数。

高山莫衣

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
2
评论
从0开始学pytorch【1】--线性函数的梯度下降

在正式学习pytorch深度框架之前，假设你已经掌握了机器学习、深度学习的梯度下降算法基础理论，但是编程技术还不够熟练，于是本文将使用python演示如何利用梯度下降法求解一元线性回归中的参数。分别为5.015464和2.77148，这总体设置的5和3很接近。前提是我们并不知道参数真实值为5和3，于是就用参数估计值5.015464和2.77148去替代总体参数。设置初始参数均为0，学习率为0.0001，迭代40000次，最后输出结果。可以对比看迭代前后的损失，设置初始参数，并输出迭代后的参数估计值。
复制链接

扫一扫