（二）线性回归问题

最新推荐文章于 2022-09-19 00:08:42 发布

爱编程的机器猫

最新推荐文章于 2022-09-19 00:08:42 发布

阅读量687

点赞数

分类专栏：深度学习（PyTorch）文章标签：线性回归线性代数算法

本文链接：https://blog.csdn.net/qq_45849192/article/details/122733748

版权

深度学习（PyTorch）专栏收录该内容

10 篇文章 2 订阅

订阅专栏

（二）线性回归问题

首先我们来看一个方程：
$y = w * x + b$
这里我们只要得到两组 $x$ 和 $y$ 的值就可以对 $w$ 和 $b$ 精确求解。

但是在实际问题中我们得到线性方程不会是这样，而是：
$\epsilon$
这里的 $\epsilon$ 就是我们实际生活中的一些干扰因素，这里我们称作噪声(noise)

这时我们仅用两组 $x$ 和 $y$ 的值就无法求解，所以我们需要得到很多的方程组才能求解。这里我们给出如下公式
$loss = (wx + b - y)^2$
这里我们只要通过很多方程组去求解 $w$ 和 $b$ 使得 $l o s s$ 尽可能接近为0这样虽然无法很精确求解，但是也能很好满足我们求解实际问题的需要

这样我们通过数据的很多组 $x$ 和 $y$ 的值就可以让我们方程更加精确，具体如下：

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存失败,源站可能有防盗链机制,建议将图片保存下来直接上传上传(imqC2X8YJSrR-1643360025224)(C:\Users\ying\AppData\Roaming\Typora\typora-user-images\image-20220128161808429.png)(C:\Users\ying\AppData\Roaming\Typora\typora-user-images\image-20220128161808429.png)]$

下面说明最小化 $l o s s$ 的思路：

（1）求偏导，通过偏导数可以得到 $l o s s$ 对 $w$ 和 $b$ 的当前位置的梯度信息
$\frac{\partial loss}{\partial w} = 2x(wx + b - y)$

$\frac{\partial loss}{\partial b} = 2(wx + b - y)$

（2）以下 $w$ 和 $b$ 的迭代更新公式，我们让当前的 $w$ 和 $b$ 的值减去各自当前位置的梯度就能让 $w$ 和 $b$ 去不断逼近其梯度为0的点，这样 $l o s s$ 函数就能不断逼近其极小值点，而这就是我们想要的结果。
$\frac{\Delta loss}{\Delta w}$

$\frac{\Delta loss}{\Delta b}$

我们通过每次计算的 $w$ 和 $b$ 的梯度来迭代更新 $w$ 和 $b$ 的值

求解思路很简单，下面我们来进行下简单的实战。

这里我们sample一些点的数据，第一个数为 $x$ ，第二个数为 $y$

下面为代码：

import numpy as np


def step_gradient(points, learningRate, w_current, b_current):
    """
    这个函数用来计算梯度
    :param points: 点的数据，第一列为x， 第二列为y
    :param learningRate: 学习率
    :param w_current: 当前w的值
    :param b_current: 当前b的值
    :return: 使用公式新的计算的w，b的值
    """
    w_gradient = 0
    b_gradient = 0
    n = len(points)
    for i in range(n):
        x = points[i][0]
        y = points[i][1]
        w_gradient += 2 * x * (w_current * x + b_current - y)
        b_gradient += 2 * (w_current * x + b_current - y)
    w_new = w_current - w_gradient / n * learningRate
    b_new = b_current - b_gradient / n * learningRate
    return [w_new, b_new]

def gradient_iterate(points, learnRate, iterations, w_gradient, b_gradient):
    """
    函数进行梯度的迭代
    :param points: 点的数据，第一列为x， 第二列为y
    :param learnRate: 学习率
    :param iterations: 迭代次数，即训练次数
    :param w_gradient: 当前w的值
    :param b_gradient: 当前b的值
    :return: 迭代最后的w，b的值
    """
    n = len(points)
    for i in range(iterations):
        [w_gradient, b_gradient] = step_gradient(points, learnRate, w_gradient, b_gradient)
    return [w_gradient, b_gradient]

def loss_calculate(points, w_gradient, b_gradient):
    """
    计算总的loss
    :param points: 点的数据，第一列为x， 第二列为y
    :param w_gradient: w的梯度
    :param b_gradient: b的梯度
    :return: 总的loss
    """
    lossTotal = 0 # 总的loss
    for i in range(len(points)):
        x = points[i][0]
        y = points[i][1]
        lossTotal += (w_gradient * x + b_gradient - y) ** 2
    return lossTotal

if __name__ == '__main__':
    points = np.genfromtxt("data.csv", dtype=float, delimiter=',')  # 导入数据
    w_initial = 0    # 初始化w
    b_initial = 0   # 初始化b
    learningRate = 0.0001   # lr设置小一点，这样结果会比较好
    iterations = 1000   # 迭代次数
    [w, b] = gradient_iterate(points, learningRate, iterations, w_initial, b_initial)
    loss = loss_calculate(points, w, b)
    print("w = %f, b = %f, loss = %f" % (w, b, loss))

[外链图片转存中...(img-3USlP11U-1643360025225)]
计算结果如上。

爱编程的机器猫

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
（二）线性回归问题

（二）线性回归问题首先我们来看一个方程：y=w∗x+by = w * x + by=w∗x+b这里我们只要得到两组xxx和yyy的值就可以对www和bbb精确求解。但是在实际问题中我们得到线性方程不会是这样，而是：y=w∗x+b+ϵy = w * x + b + \epsilony=w∗x+b+ϵ这里的ϵ\epsilonϵ就是我们实际生活中的一些干扰因素，这里我们称作噪声(noise)这时我们仅用两组xxx和yyy的值就无法求解，所以我们需要得到很多的方程组才能求解。这里我们给出如下公
复制链接

扫一扫