网络模型（RNN-循环神经网络）

最新推荐文章于 2024-06-16 18:20:04 发布

曲奇喵

最新推荐文章于 2024-06-16 18:20:04 发布

阅读量459

点赞数

分类专栏： AI 文章标签： pytorch 神经网络深度学习 RNN 循环神经网络

本文链接：https://blog.csdn.net/afsya/article/details/106858802

版权

AI 专栏收录该内容

13 篇文章 2 订阅

订阅专栏

概念

用于处理序列问题：翻译（N vs N）、信息提取（N vs 1）、生成（1 vs N）。
RNN
1 vs N
1vsN
N vs 1
Nvs1
N vs N
NvsN

实验（手写数字识别）

数据集：MNIST。
网络结构：RNN + 全连接。
优化器：Adam。
损失函数：交叉熵（CrossEntropyLoss），自带 one-hot 类型和 softmax。
输出：one-hot 类型，结果为最大的索引值。

网络

import torch
from torch import nn


class MyNet(nn.Module):
    def __init__(self):
        super().__init__()
        self.rnn = nn.RNN(28, 64, 2, batch_first=True)
        # 输出层：返回 one-hot 类型
        self.mlp = nn.Linear(28 * 64, 10)

    def forward(self, x):
        out, _ = self.rnn(x)
        # [n,s,v] → [n,s*v]
        out = out.reshape(-1, 28 * 64)
        return self.mlp(out)

训练

import torch
from torch import nn
from torchvision import datasets, transforms
from torch.utils.data import DataLoader
import os
from PIL import Image, ImageDraw, ImageFont
from matplotlib import pyplot as plt

from net import MyNet


batch_size = 100
net_path = r"modules/mynet.pth"

train_flag = False

# 数据集
transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize([0.5], [0.5])])
if train_flag:
    dataset = datasets.MNIST(r"data", train=True, transform=transform, download=True)
    dataloader = DataLoader(dataset, batch_size, shuffle=True)
else:
    dataset = datasets.MNIST(r"data", train=False, transform=transform, download=False)
    dataloader = DataLoader(dataset, batch_size, shuffle=False)


if __name__ == '__main__':
    # 加载网络
    if os.path.isfile(net_path):
        net = torch.load(net_path)
    else:
        net = MyNet()
    opt = torch.optim.Adam(net.parameters())
    loss_fn = nn.CrossEntropyLoss()

    if train_flag:
        # 训练
        net.train()
        while True:
            for i, (x, y) in enumerate(dataloader):
                x = x.reshape(-1, 28, 28)
                out = net(x)
                loss = loss_fn(out, y)
                opt.zero_grad()
                loss.backward()
                opt.step()
                # 结果是 one-hot 类型，取最大索引
                result = torch.argmax(out, 1)
                acc = torch.mean(torch.eq(result, y).float())
                print("i:{},loss:{:.5},acc:{:.3}".format(i, loss, acc))
            # 保存网络
            torch.save(net, net_path)
    else:
        # 测试
        net.eval()
        font = ImageFont.truetype(r"arial.ttf", size=10)
        plt.ion()
        for x, y in dataloader:
            # [n,c,h,w] → [h,w]
            img_array = x[0][0] * 255
            img = Image.fromarray(img_array.numpy())
            draw = ImageDraw.ImageDraw(img)

            x = x.reshape(-1, 28, 28)
            out = net(x)
            result = torch.argmax(out, 1)
            draw.text((0, 0), str(result[0].item()), 255, font)

            plt.imshow(img)
            plt.pause(0.5)
        plt.ioff()

曲奇喵

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
网络模型（RNN-循环神经网络）

概念用于处理序列问题：翻译（N vs N）、信息提取（N vs 1）、生成（1 vs N）。1 vs NN vs 1N vs N实验（手写数字识别）数据集：MNIST。网络结构：RNN + 全连接。优化器：Adam。损失函数：交叉熵（CrossEntropyLoss），自带 one-hot 类型和 softmax。输出：one-hot 类型，结果为最大的索引值。网络import torchfrom torch import nnclass MyNet(nn.Modul
复制链接

扫一扫

专栏目录