pytorch进阶学习（每日一更）day05--循环神经网络的实现

最新推荐文章于 2023-03-17 16:18:26 发布

地平线here

最新推荐文章于 2023-03-17 16:18:26 发布

阅读量326

点赞数

分类专栏： pytorch学习库文章标签： pytorch rnn 深度学习

本文链接：https://blog.csdn.net/qq_43570557/article/details/122640555

版权

pytorch学习库专栏收录该内容

19 篇文章 1 订阅

订阅专栏

Recurrent Neural Network

一个简单的RNN的实现

架构：

主要有3层;详见代码

class ConvNet(nn.Module):
    def __init__(self,num_classes):
        super(ConvNet,self).__init__()
        #定义层结构(3大层)
        #layer1
        self.layer1=nn.Sequential(
            #kernel_size就是卷积核大小这里的5代表过滤器为5*5
            nn.Conv2d(1,16,kernel_size=5,stride=1,padding=2),
            nn.BatchNorm2d(16),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2,stride=2))
        #layer2
        self.layer2=nn.Sequential(
            nn.Conv2d(16, 32, kernel_size=5, stride=1, padding=2),
            nn.BatchNorm2d(32),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2, stride=2))
        #layer3
        self.fc=nn.Linear(7*7*32,num_classes)

    def forward(self,x):
        out=self.layer1(x)
        out=self.layer2(out)
        #从layer2到FC层需要一次shape变化
        out=out.reshape(out.size(0),-1)
        #即输入7*7*32  --》  输出7*7*32
        out=self.fc(out)
        return out

完整代码：


import torch
import torchvision
import torch.nn as nn
import torchvision.transforms as transforms

#1.GPU
device=torch.device("cuda" if torch.cuda.is_available() else "cpu")

#2.设置超参
num_epochs=5
num_classes=10
batch_size=100
learning_rate=0.001

# 3.加载数据
train_data=torchvision.datasets.MNIST(root="MNIST",
                           train=True,
                           download=True,
                           transform=transforms.ToTensor())

test_data=torchvision.datasets.MNIST(root="MNIST",
                           train=False,
                           download=True,
                           transform=transforms.ToTensor())

#4.数据加载
train_loader=torch.utils.data.DataLoader(dataset=train_data,
                            batch_size=batch_size,
                            shuffle=True)
test_loader=torch.utils.data.DataLoader(dataset=test_data,
                            batch_size=batch_size,
                            shuffle=False)

#5.设置RNN循环神经网络模型
class ConvNet(nn.Module):
    def __init__(self,num_classes):
        super(ConvNet,self).__init__()
        #定义层结构(3大层)
        #layer1
        self.layer1=nn.Sequential(
            #kernel_size就是卷积核大小这里的5代表过滤器为5*5
            nn.Conv2d(1,16,kernel_size=5,stride=1,padding=2),
            nn.BatchNorm2d(16),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2,stride=2))
        #layer2
        self.layer2=nn.Sequential(
            nn.Conv2d(16, 32, kernel_size=5, stride=1, padding=2),
            nn.BatchNorm2d(32),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2, stride=2))
        #layer3
        self.fc=nn.Linear(7*7*32,num_classes)

    def forward(self,x):
        out=self.layer1(x)
        out=self.layer2(out)
        #从layer2到FC层需要一次shape变化
        out=out.reshape(out.size(0),-1)
        #即输入7*7*32  --》  输出7*7*32
        out=self.fc(out)
        return out

model=ConvNet(num_classes).to(device)

#6.定义模型
#loss
criterion=nn.CrossEntropyLoss()
optimizer=torch.optim.Adam(model.parameters(),
                 lr=learning_rate)

#7.训练模型
total_step=len(train_loader)
for epoch in range(1,num_epochs+1):
    for i,(images,labels) in enumerate(train_loader):
        #数据处理
        images=images.to(device)
        labels=labels.to(device)

        #forward
        prev=model(images)
        #loss compute
        loss=criterion(prev,labels)

        #backfard
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        #print
        if (i+1)%100==0:
            print("Epoch[{}/{}],Step[{}/{}],Loss:{:.4f}"
                  .format(epoch,num_epochs,i,total_step,loss.item()))

model.eval()
                # 如果模型中用了dropout或bn，
                # 那么predict时必须使用eval
                # 否则结果是没有参考价值的，不存在选择的余地。

#8.模型测试
with torch.no_grad():
    correct=0
    total=0
    for images,labels in test_loader:
        images=images.to(device)
        labels=labels.to(device)

        output=model(images)
        _,predeicted=torch.max(output.detach(),1)

        total+=labels.size(0)
        correct+=(predeicted==labels).sum()

    print(' Test Accuracy of the model on the 10000 test  images: {}'.format(correct*100/total))

#9.保存模型
torch.save(model.state_dict(),"model.cktp")