《PyTorch深度学习实践》刘二大人课程5用pytorch实现线性传播学习笔记

小赵同学871

已于 2023-04-14 15:51:30 修改

阅读量130

点赞数

分类专栏： Pytorch学习文章标签：深度学习 pytorch 学习

于 2023-04-14 15:49:33 首次发布

本文链接：https://blog.csdn.net/weixin_70379932/article/details/130134341

版权

Pytorch学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

5.用pytorch实现线性传播

用pytorch构建深度学习模型训练数据的一般流程如下：

准备数据集
设计模型Class，一般都是继承nn.Module类里，目的为了算出预测值
构建损失和优化器
开始训练，前向传播，反向传播，更新

准备数据
这里需要注意的是准备数据这块，数据是张量形式，而且数据维度要正确，体现在数据的行为样本数，列为特征数目

由于这里的损失是批量计算的，所以这里计算出的是损失的向量，可以通过计算平均值来得到损失值

构造模型

这里pytorch里自带的Linear层利用的是讲W进行转置去求y值如下图，我们只要输入输入和输出的特征维度即可

在这里插入图片描述
设计模型：
torch.nn.Linear（）是一个类，三个参数，第一个为输入的样本特征，输出的样本特征，同时还有个偏置项，看是否加入偏置

在这里插入图片描述

这里简单记录下两个pytorch里的小知识点，其中参数*args代表把前面n个参数变成n元组，**kwargsd会把参数变成一个词典
在这里插入图片描述

在这里插入图片描述

定义模型类，先初始化函数导入需要的线性模型，然后调用预测y值
在这里插入图片描述
定义损失函数和优化器

在这里插入图片描述
记住梯度清零然后反向传播，然后梯度更新

拿个值来预测一下

整体的流程

常见的优化器

全部代码：

import torch
# prepare dataset
# x,y是矩阵，3行1列 也就是说总共有3个数据，每个数据只有1个特征
x_data = torch.tensor([[1.0], [2.0], [3.0]])
y_data = torch.tensor([[2.0], [4.0], [6.0]])
 
#design model using class
"""
our model class should be inherit from nn.Module, which is base class for all neural network modules.
member methods __init__() and forward() have to be implemented
class nn.linear contain two member Tensors: weight and bias
class nn.Linear has implemented the magic method __call__(),which enable the instance of the class can
be called just like a function.Normally the forward() will be called 
"""
class LinearModel(torch.nn.Module):
    def __init__(self):
        super(LinearModel, self).__init__()
        # (1,1)是指输入x和输出y的特征维度，这里数据集中的x和y的特征都是1维的
        # 该线性层需要学习的参数是w和b  获取w/b的方式分别是~linear.weight/linear.bias
        self.linear = torch.nn.Linear(1, 1)
 
    def forward(self, x):
        y_pred = self.linear(x)
        return y_pred
 
model = LinearModel()
 
# construct loss and optimizer
# criterion = torch.nn.MSELoss(size_average = False)
criterion = torch.nn.MSELoss(reduction = 'sum')
optimizer = torch.optim.SGD(model.parameters(), lr = 0.01) # model.parameters()自动完成参数的初始化操作，这个地方我可能理解错了
 
# training cycle forward, backward, update
for epoch in range(100):
    y_pred = model(x_data) # forward:predict
    loss = criterion(y_pred, y_data) # forward: loss
    print(epoch, loss.item())
 
    optimizer.zero_grad() # the grad computer by .backward() will be accumulated. so before backward, remember set the grad to zero
    loss.backward() # backward: autograd，自动计算梯度
    optimizer.step() # update 参数，即更新w和b的值
 
print('w = ', model.linear.weight.item())
print('b = ', model.linear.bias.item())
 
x_test = torch.tensor([[4.0]])
y_test = model(x_test)
print('y_pred = ', y_test.data)

作业代码：只用了其中一个优化器Adam

import torch

#加载数据
x_data = torch.tensor([[1.0],[2.0],[3.0]])  #构建为3x1的张量数据
y_data = torch.tensor([[2.0],[4.0],[6.0]])

#定义模型model类
class Model(torch.nn.Module):
    def __init__(self):
        super(Model,self).__init__()        #继承父类
        self.linear = torch.nn.Linear(1,1)  #定义线性对象实例化
    
    def forward(self,x):
        y_pred = self.linear(x)
        return y_pred

#定义损失函数
model = Model()                  #实例化
criterion = torch.nn.MSELoss()   #定义损失函数，求平均加了size_average=False后收敛速度更快
optimizer = torch.optim.Adam(model.parameters(),lr=0.01)  #定义优化器，参数传入为model需要更新的参数

loss_list = []
#前向传播，迭代循环
for epoch in range(100):
    y_pred = model(x_data)           #预测y
    loss = criterion(y_pred,y_data)  #计算损失值
    loss_list.append(loss)           

    print(epoch,loss.item())

    optimizer.zero_grad()            #梯度都变为0
    loss.backward()                  #loss损失反向传播
    optimizer.step()                 #通过优化器更新参数

print('w=',model.linear.weight.item())
print('b=',model.linear.bias.item())

x_test = torch.tensor([[4.0]])
y_pred = model(x_test)
print(y_pred.data)
import matplotlib.pyplot as plt
import numpy as np

epoch_list = list(np.arange(0,100,1))
plt.plot(epoch_list,loss_list)
plt.xlabel('epoch')
plt.ylabel('loss')
plt.title('Adam')
plt.show()

小赵同学871

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
《PyTorch深度学习实践》刘二大人课程5用pytorch实现线性传播学习笔记

这里简单记录下两个pytorch里的小知识点，其中参数*args代表把前面n个参数变成n元组，**kwargsd会把参数变成一个词典。torch.nn.Linear（）是一个类，三个参数，第一个为输入的样本特征，输出的样本特征，同时还有个偏置项，看是否加入偏置。定义模型类，先初始化函数导入需要的线性模型，然后调用预测y值。记住梯度清零然后反向传播，然后梯度更新。定义损失函数和优化器。
复制链接

扫一扫