继上次写的MNIST数字识别代码,我又开始尝试手写汉字的识别啦
于是上网查资料,本篇博客主要参考了此博客,并在其基础上增加了一些给像我一样小白同学的内容,若此博客内容侵犯了您的权益,请与我联系及时删除 😃
重点:原作者博客:「Pytorch」CNN实现手写汉字识别(数据集制作,网络搭建,训练验证测试全部代码)
在这先感谢此博客大佬的无私分享,给我们这些小白提供了巨大的帮助!
首先放上一些对下文理解有帮助的函数介绍,有像我一样什么也不懂的同学可以参考一下 😃
可能有点多,都是容易理解的内容,需要耐心哦
如果有大佬知道好的网站,欢迎推荐啊!! 廖雪峰老师的教程很不错!
- Python File readlines() 方法
- Python中
__init__
的用法和理解 - Python
__getitem__
方法理解 - python中
__len__
用法 - 类中
super
函数的理解 - Pytorch
torchvision.transforms
的解释
① 导入模块
import os
import torch
import torch.nn as nn
import torch.nn.functional as F
import torchvision.transforms as transforms
from torch.utils.data import DataLoader, Dataset
from PIL import Image
② 超参数定义
EPOCH = 10 # 训练次数
BATCH_SIZE = 50 # 数据集划分
LR = 0.001 # 学习率
③ 提取数据集的路径
将每个汉字的图片集都标上标签,这里有100个数字的图片集
全部数据资料在此文章作者的网盘中,数据集超级全面但是也超级大,下载需要一定时间,大家可以到这里下载上图中的数据运行操作一下
def classes_txt(root, out_path, num_class=None):
dirs = os.listdir(root) # 列出根目录下所有类别所在文件夹名
if not num_class: # 不指定类别数量就读取所有
num_class = len(dirs)
if not os.path.exists(out_path): # 输出文件路径不存在就新建
f = open(out_path, 'w')
f.close()
# 如果文件中本来就有一部分内容,只需要补充剩余部分
# 如果文件中数据的类别数比需要的多就跳过
with open(out_path, 'r+') as f:
try:
end = int(f.readlines()[-1].split('/')[-2]) + 1
except:
end = 0
if end < num_class - 1:
dirs.sort()
dirs = dirs[end:num_class]
for dir in dirs:
files = os.listdir(os.path