使用深度学习框架来实现线性回归模型

最新推荐文章于 2024-07-05 13:28:02 发布

少写代码少看论文多多睡觉

最新推荐文章于 2024-07-05 13:28:02 发布

阅读量861

点赞数 1

分类专栏： # 动手学深度学习人工智能文章标签：深度学习线性回归 pytorch

本文链接：https://blog.csdn.net/qq_44653420/article/details/125097866

版权

人工智能同时被 2 个专栏收录

42 篇文章 2 订阅

订阅专栏

动手学深度学习

25 篇文章 1 订阅

订阅专栏

使用深度学习框架来实现线性回归模型

一、生成数据集

直接调用d2l中的synthetic_data生成数据集

# 生成数据集
import numpy as np
import torch
from torch.utils import data
from d2l import torch as d2l

true_w = torch.tensor([2,-3.4])
true_b = 4.2
features,labels = d2l.synthetic_data(true_w,trye_b,1000)  # 生成X，和y

二、读取数据集

调用框架中现有的API来读取数据，我们将features和labels作为API的参数传递，并通过数据迭代器指定batch_size,此外布尔值is_train表示是否希望数据迭代器对象在每一个迭代周期内打乱数据。


# 读取数据集
def load_array(data_arrays,batch_size,is_train = True):
    """构造一个Pytorch数据迭代器"""
    # TensorDataset对数据进行封装，传入参数是：data_tensor target_tensor 所以这里对元组进行解包操作
    dataset = data.TensorDataset(*data_arrays)
    
    # DataLoader对数据进行加载
    return data.DataLoader(dataset,batch_size,shuffle = is_train)

batch_size = 10
# 返回一个迭代器
data_iter = load_array((features,labels),batch_size)
next(iter(data_iter))

这里使用Iter构造python迭代器，并使用Next从迭代器中获取第一项。

三、定义模型

对于标准深度学习模型，我们可以使用框架的预定义好的层。首先定义一个模型变量Net,它是一个Squential类的实例，Sequential类将多个层串联在一起。当给定输入数据时，Sequential实例将数据传入到第一层中，然后将第一层的输出作为第二层的输入

线性回归模型是单层网络结构，这一单层称之为全连接层（full-connected layer）。全连接层在Linear类中定义，将两个参数传入nn.Linear中，第一个指定输入特征形状，即2，第二个指定输出特征形状，输出特征形状为单个标量，即1

# nn是神经网络的缩写
from torch import nn
net = nn.Sequential(nn.Linear(2,1))

四、初始化模型参数

net[0]选择网络中的第一个层，使用weight.data和bias.data方法访问参数，我们还可以使用替换的方法normal_和fill_来重写参数值。

net[0].weight.data.normal_(0,0.01)
net[0].bias.data.fill_(0)

五、定义损失函数

loss = nn.MSELoss()

计算均方误差使用的是MSELoss类，也称之为平方L2范数，它返回所有样本损失的平均值。

六、定义优化算法

小批量随机梯度下降算法是优化神经网络的标准工具，Pytorch在optim模块中实现了该算法的许多变种，当实例化一个SGD实例，我们要指定优化的参数（可以通过Net.parameters()从我们的模型中获得）以及优化算法所需要的超参数字典。小批量随机梯度下降只需要设置学习率。

trainer = torch.optim.SGD(net.parameters(),lr = 0.03)

七、训练

在每一个迭代周期里面，我们将遍历一次数据集，不停的从中获取一个小批量的输入和相应的标签，对于每一个小批量数据集，都会进行一下操作：

通过net(X)生成预测并计算损失l（前向传播）
通过进行反向传播来计算梯度
通过调用优化器来更新模型参数

num_epochs = 3
for epoch in range(num_epochs):
    for X,y in data_iter:
        l = loss(net(X),y) # 计算损失函数
        trainer.zero_grad()  # 梯度清零
        l.backward()  # 计算损失函数的梯度 反向传播
        trainer.step()  # 优化参数
    l = loss(net(features),labels)
    print(f'epoch {epoch + 1},loss {l:f}')

w = net[0].weight.data
print('w的估计误差： ',true_w - w.reshape(true_w.shape))
b = net[0].bias.data
print('b的估计误差：',true_b - b)