pytorch/MNIST/手写数据集识别/重写dataset/使用自己制作的数据库来完成模型的正确率检测

最新推荐文章于 2024-08-06 15:18:37 发布

chesheng_jpg

最新推荐文章于 2024-08-06 15:18:37 发布

阅读量924

点赞数 1

文章标签： pytorch 深度学习 python

本文链接：https://blog.csdn.net/chesheng_jpg/article/details/120856334

版权

本文介绍了如何使用PyTorch重写MNIST数据集，以便使用自己的手写数字数据进行模型验证。作者分享了在处理自定义数据集时遇到的问题及解决方案，包括读取RGBA图像、处理数据字典、转换标签为整数以及调整预处理变换。通过这些修改，模型在自定义数据集上达到了约70-80%的准确率。

摘要由CSDN通过智能技术生成

pytorch/MNIST/手写数据集识别/重写dataset/使用自己制作的数据库来完成模型的正确率检测

第一次发博文，可能有不周到之处敬请指出！（文章编辑快捷键用的就很爽）
本文针对使用MNIST数据库训练，用自己手写的数据来完成模型的验证。

MNIST模型代码

在此贴一个链接：
pytorch中文手册，网页版
注意使用pycharm用户代码移植时将代码中test函数要更改，不然会进入实例化测试线程（血泪教训）

重写dataset函数

这段我也是参考的本站中一位大佬的代码，可移步：
Pytorch自定义加载数据–自定义Dataset

大家可以先使用大佬代码，接下来我会对我出现的错误逐一更正（更正用时：~8h，实属菜鸡）

重头戏——debug

主要是针对重写的dataset函数修改。
因为代码移植后会报很多错误。

1

img = io.imread(img_path)# 读取该图片

我使用的自己的数据集是RGBA的，读入后会显示要输入通道数和数据图片的通道数不一致，为了与输入通道数一致，转化为灰度图片，所以我改为：

from PIL import Image #注意加上这个文件
img = Image.open(img_path).convert('L')  # 读取该图片

2

原文为：

		 sample = {'image':img,'label':label}#根据图片和标签创建字典
		 
         if self.transform:
             sample = self.transform(sample)#对样本进行变换
         return sample #返回该样本

这段用字典类型盛放数据我没搞懂，但是确实在debug时候报错了，说是dict不能用，要用其他类型数据，我参考了其他代码，这样改动：

        # sample = {'image': img, 'label': label}  # 根据图片和标签创建字典

        if self.transform:
            img = self.transform(img)  # 对样本进行变换
        return img,label  # 返回该样本

好啦！

3

原文：

label = img_path.split('\\')[-1].split('.')[0]  # 根据该图片的路径名获取该图片的label，

但是实际上所读取的是字符类型，我们给它要转为整数类型：

        label = img_path.split('\\')[-1].split('.')[0]  # 根据该图片的路径名获取该图片的label，
        label = int(label)

4

那个大佬在transform时候使用了None，他的原文如下：

 data = AnimalData('E:/Python Project/PyTorch/dogs-vs-cats/train',transform=None)#初始化类，设置数据集所在路径以及变换

但是我还是报错了，报错信息如下：

TypeError: default_collate: batch must contain tensors, numpy arrays, numbers, dicts or lists; found <class 'PIL.Image.Image'>

我将transform的None改成和MNIST数据集预处理的transform一样，代码如下：

 data = AnimalData('E:/Python Project/PyTorch/dogs-vs-cats/train',transform=transform=transforms.Compose([
                           transforms.ToTensor(),
                           transforms.Normalize((0.1307,), (0.3081,))
                       ]))#初始化类，设置数据集所在路径以及变换