【Pytorch】基于CNN手写汉字的识别

最新推荐文章于 2023-03-11 21:51:38 发布

知跃

最新推荐文章于 2023-03-11 21:51:38 发布

阅读量1w

点赞数 18

分类专栏： Pytorch python 文章标签： python 神经网络机器学习

本文链接：https://blog.csdn.net/weixin_44403922/article/details/104451698

版权

这篇博客主要介绍了如何使用Pytorch基于CNN进行手写汉字识别，内容包括数据集准备、神经网络搭建、模型训练等步骤。作者在原有博客的基础上增加了详细解释，适合初学者。最终模型在有限的数据集上取得了较高的准确性。

摘要由CSDN通过智能技术生成

继上次写的MNIST数字识别代码，我又开始尝试手写汉字的识别啦
于是上网查资料，本篇博客主要参考了此博客，并在其基础上增加了一些给像我一样小白同学的内容，若此博客内容侵犯了您的权益，请与我联系及时删除 😃
重点：原作者博客：「Pytorch」CNN实现手写汉字识别（数据集制作，网络搭建，训练验证测试全部代码）
在这先感谢此博客大佬的无私分享，给我们这些小白提供了巨大的帮助！

首先放上一些对下文理解有帮助的函数介绍，有像我一样什么也不懂的同学可以参考一下 😃
可能有点多，都是容易理解的内容，需要耐心哦
如果有大佬知道好的网站，欢迎推荐啊！！廖雪峰老师的教程很不错！

① 导入模块

import os
import torch
import torch.nn as nn
import torch.nn.functional as F
import torchvision.transforms as transforms
from torch.utils.data import DataLoader, Dataset
from PIL import Image

② 超参数定义

EPOCH = 10 # 训练次数
BATCH_SIZE = 50 # 数据集划分
LR = 0.001 # 学习率

③ 提取数据集的路径

将每个汉字的图片集都标上标签，这里有100个数字的图片集
在这里插入图片描述
全部数据资料在此文章作者的网盘中，数据集超级全面但是也超级大，下载需要一定时间，大家可以到这里下载上图中的数据运行操作一下

def classes_txt(root, out_path, num_class=None):

    dirs = os.listdir(root) # 列出根目录下所有类别所在文件夹名
    if not num_class:		# 不指定类别数量就读取所有
        num_class = len(dirs)

    if not os.path.exists(out_path): # 输出文件路径不存在就新建
        f = open(out_path, 'w')
        f.close()
	# 如果文件中本来就有一部分内容，只需要补充剩余部分
	# 如果文件中数据的类别数比需要的多就跳过
    with open(out_path, 'r+') as f:
        try:
            end = int(f.readlines()[-1].split('/')[-2]) + 1
        except:
            end = 0
        if end < num_class - 1:
            dirs.sort()
            dirs = dirs[end:num_class]
            for dir in dirs:
                files = os.listdir(os.path