08 Pytorch实现线性回归

最新推荐文章于 2023-09-13 20:49:06 发布

蓝子娃娃

最新推荐文章于 2023-09-13 20:49:06 发布

阅读量195

点赞数 1

分类专栏：深度学习

本文链接：https://blog.csdn.net/qq_41033011/article/details/109328702

版权

深度学习专栏收录该内容

19 篇文章 8 订阅

订阅专栏

Pytorch实现线性回归

这一篇博客主要介绍怎样使用 Pytorch 提供的工具帮助我们重现线性模型的过程。比如我们怎么构造神经网络，如何构造损失函数以及如何构造随机梯度下降的优化器。

我们首先回忆一下之前学习的线性模型中，首先需要确定我们的模型，之后要定义损失函数，而且损失函数计算出来的值必须是一个标量值。

在这里插入图片描述

我们用 Pytorch 来写深度神经网络，第一步先要准备数据集（Prepare dataset），第二步就是要设计模型（计算 y_hat），第三步构造损失函数和优化器，第四步就是写训练周期（forward、backward、update），forward 计算损失，backward 计算梯度，update 就是用梯度下降算法更新权重。

在这里插入图片描述

1. Prepare Dataset

那么首先来看看怎么准备数据？我们之前使用的都是两个向量 x_data 和 y_data。在这次的例子中，我们使用 mini-batch 这样一个风格，意思是我们现在想要一次性将结果都求解出来。

在这里插入图片描述

对于之前的模型 y_hat = $w * x + b$ ，现在有三个数据样本 $x_1, y_1)$ ， $x_2, y_2)$ 和 $x_3, y_3)$ ，之后要求损失函数就得把所有对 $x$ 的 y_hat 求解出来，即 y_hat1 = $w*x_1 + b$ ， y_hat2 = $w*x_2 + b$ ，y_hat3 = $w*x_3 + b$ 。我们在使用 numpy 时，里面有一种广播机制，如果你用一个 3x3 的矩阵和一个 3x1 的矩阵相加，原理上是不能相加的，但是 numpy 会将第二个矩阵扩充成 3x3 的矩阵，会进行这样的自动广播。比如：

在这里插入图片描述

接下来，我们再来看这三个式子。

在这里插入图片描述

如果我们把这三个式子写成向量化的表达方式：

在这里插入图片描述

那么我们注意里面这个维度，y_hat 是一个 3 行 1 列的矩阵， $x$ 也是一个 3 行 1 列的矩阵，所以在进行计算的时候， $w$ 会被自动进行广播扩充为 3 行 1 列的矩阵， $b$ 同理也会被自动进行广播扩充为 3 行 1 列的矩阵。

在这里插入图片描述

这就是我们在使用 Pytorch 进行小批量计算时所使用的方法。

将来我们在计算损失时，损失的式子是：

在这里插入图片描述
那么对于每一个样本，相应的损失就等于：

在这里插入图片描述

当我们将上面的式子进行向量化，就变成：

在这里插入图片描述

所以我们在构造数据集的时候， $x$ 和 $y$ 的值必须是矩阵。

在这里插入图片描述

2. Design Model

之前我们是人工求解导数，就是把导数的解析式求解出来，那么到了 Pytorch 之后，我们就不再考虑人工来求解导数，我们的重点目标变成了构造计算图。只要能够把计算图构造出来，那么将来它会自动帮我们把梯度求解出来，然后就可以直接做优化了。这就是第二步要做的事情，Design Model。在我们这个例子中，用了一个仿射模型，Pytorch 将它称做 Linear Unit（线性单元）。一个线性单元就是 $w * x + b$ ，这个线性单元将来我们构造的时候，需要确定权重 $w$ 的 shape 是什么？ $b$ 的 shape 是什么？

在这里插入图片描述

那么我们要想确定 $w$ 的大小，那么我们就得先确定 $x$ 的 shape，比如 $z = w x + b$ ， $x$ 是一个 4x1 的矩阵， $z$ 是一个 3x1 的矩阵，那么 $w$ 就得是一个 3x4 的矩阵， $b$ 是一个 3x1 的矩阵。所以对于 Linear Unit 来说，我们要想确定权重的维度，就需要知道 $x$ 的维度，还需要知道输出的 y_hat 的维度，只要知道了这两个值，那么就可以确定 $w$ 和 $b$ 的维度。y_hat 计算出来之后，下一步就要计算 Loss 函数，最终求出损失值。