pytorch 搭建网络步骤

最新推荐文章于 2024-07-22 11:53:13 发布

冲上云霄！

最新推荐文章于 2024-07-22 11:53:13 发布

阅读量1.4k

点赞数 6

分类专栏： python

本文链接：https://blog.csdn.net/qq_45847624/article/details/114885655

版权

python 专栏收录该内容

13 篇文章 1 订阅

订阅专栏

pytorch 搭建网络步骤

准备数据
定义网络结构model
定义损失函数
定义优化算法 optimizer
（有是还要定义更新学习率：scheduler=StepLR() )
训练
　　5.1 准备好tensor形式的输入数据和标签(可选)
　　5.2 前向传播计算网络输出output 和计算损失函数loss
　　5.3 反向传播更新参数
　　　　以下三句话一句也不能少：
　　　　5.3.1 optimizer.zero_grad() 将上次迭代计算的梯度值清0
　　　　5.3.2 loss.backward() 反向传播，计算梯度值
　　　　5.3.3 optimizer.step() 更新权值参数
　　　（ schedule.step(episode) 更新学习率)
　　5.4 保存训练集上的loss和验证集上的loss以及准确率以及打印训练信息。（可选
图示训练过程中loss和accuracy的变化情况(可选)
在测试集上测试

示例代码：

import torch
import torch.nn.functional as F
import matplotlib.pyplot as plt

# 1.准备数据 generate data
x=torch.unsqueeze(torch.linspace(-1,1,100),dim=1)
print(x.shape)
y=x*x+0.2*torch.rand(x.size())
#显示数据散点图
plt.scatter(x.data.numpy(),y.data.numpy())

# 2.定义网络结构 build net
class Net(torch.nn.Module):
    #n_feature:输入特征个数  n_hidden:隐藏层个数 n_output:输出层个数
    def __init__(self,n_feature,n_hidden,n_output):
        # super表示继承Net的父类，并同时初始化父类的参数
        super(Net,self).__init__()
        # nn.Linear代表线性层 代表y=w*x+b  其中w的shape为[n_hidden,n_feature] b的shape为[n_hidden]
        # y=w^T*x+b 这里w的维度是转置前的维度 所以是反的
        self.hidden =torch.nn.Linear(n_feature,n_hidden)
        self.predict =torch.nn.Linear(n_hidden,n_output)
        print(self.hidden.weight)
        print(self.predict.weight)
    #定义一个前向传播过程函数
    def forward(self, x):
        #         n_feature  n_hidden  n_output
        #举例(2,5,1)   2         5         1
        #                    -  **  -
        #             ** - - -  **  - -
        #                    -  **  - - - **
        #             ** - - -  **  - -
        #                    -  **  -
        #            输入层    隐藏层    输出层
        x=F.relu(self.hidden(x))
        x=self.predict(x)
        return x
# 实例化一个网络为net
net = Net(n_feature=1,n_hidden=10,n_output=1)
print(net)
# 3.定义损失函数 这里使用均方误差(mean square error)
loss_func=torch.nn.MSELoss()
# 4.定义优化器 这里使用随机梯度下降
optimizer=torch.optim.SGD(net.parameters(),lr=0.2)
#定义300遍更新 每10遍显示一次
plt.ion()
# 5.训练
for t in range(100):
    prediction = net(x)     # input x and predict based on x
    loss = loss_func(prediction, y)     # must be (1. nn output, 2. target)
    # 5.3反向传播三步不可少
    optimizer.zero_grad()   # clear gradients for next train
    loss.backward()         # backpropagation, compute gradients
    optimizer.step()        # apply gradients

    if t % 10 == 0:
        # plot and show learning process
        plt.cla()
        plt.scatter(x.data.numpy(), y.data.numpy())
        plt.plot(x.data.numpy(), prediction.data.numpy(), 'r-', lw=5)
        plt.text(0.5, 0, 'Loss=%.4f' % loss.data.numpy(), fontdict={'size': 20, 'color':  'red'})
        plt.show()
        plt.pause(0.1)

plt.ioff()