PyTorch自建数据集+可视化结果

最新推荐文章于 2025-08-15 22:37:04 发布

Swayzzu

最新推荐文章于 2025-08-15 22:37:04 发布

阅读量1.4k

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习文章标签：人工智能 pytorch 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Swayzzu/article/details/121164368

深度学习专栏收录该内容

26 篇文章

订阅专栏

该博客介绍了如何构建和训练一个使用ResNet的卷积神经网络，针对自定义的神奇宝贝数据集进行图像分类。首先，详细阐述了数据集的准备，包括文件夹映射、图片标签对应、数据分割和处理。接着，针对ResNet模型进行了调整以适应输入的图像尺寸。在训练与可视化阶段，通过DataLoader加载数据，利用visdom进行训练过程的可视化，并实现了模型的训练、测试及性能评估。最终，模型在交叉验证集上的准确率达到89%，测试集上达到88%。

目录

一、自定义数据集

1.文件夹映射

2.图片对应标签

3.训练及测试数据分割

二、ResNet处理

三、训练及可视化

1.数据集导入

3.训练过程及可视化

一、自定义数据集

现有数据如下：

5个文件夹，每个文件夹是神奇宝贝的一种。

每个图片形状、大小、格式不一。

我们训练CNN的时候需要的是tensor类型的数据，因此需要将所有的图片进行下列转换：

1.对文件夹编号，进行映射，比如妙蛙种子文件夹编号0，皮卡丘编号1等。

2.对文件夹中所有图片，进行编号的对应，这个就是标签。并保存为一个csv文件。

3.图片信息获取：分为train,val,test

4.处理图片，使其成为torch可以处理的类型

1.文件夹映射

前半部分为文件夹的映射。我们希望传入数据的时候直接传入文件夹的名字，而文件夹所在的路径就是py文件所在的路径，因此这样可以直接读取。对于路径的操作使用os.path.join进行。

2.图片对应标签

输入的filename，就是我们将图片和标签信息存储的文件。

使用glob.glob方法，可以轻松调取路径下的所有指定类型的文件。

将名字和标签对应好后，通过csv.writer，可以将信息以csv格式写入新文件。

以上是保存的部分，在这个函数中，我们还要重新读取一下这个文件，因为要在这个类中获得最终的图片，以及标签，并且返回。

3.训练及测试数据分割

这里是第一步的图片的后半部分，导入了图片之后，对其进行分割，这里是按照训练、交叉验证、测试，分别是0.6,0.2,0.2进行分割的。

分割完毕后的self.images, self.labels，就可以拿来进行tensor相关的处理了。

4.数据处理

上面几步是准备工作，接下来定义的__getitem__是为了能够使train_loader = DataLoader()这一语句实现。在这里面直接将数据进行我们希望进行的转换。比如大小、旋转、裁剪等。

最后返回处理好的图片，以及tensor化的标签。

另外，还需要定义一个__len__，使得我们可以获得数据集长度。

二、ResNet处理

我们要用ResNet对图片进行处理，因此其中的参数需要进行一定的修改。

主要的修改部分是ResNet18之中的resblock模块。因为我们希望输入的是3通道，224*224的图片，因此在这里对通道，步长进行一定的修改，并进行测试，成功之后便可以进行训练了。

三、训练及可视化

1.数据集导入

同时把GPU设备相关代码准备好，并且由于需要可视化，因此先实例化visdom，并且在终端上输入python -m visdom.server，打开visdom监视终端。

2.测试函数

先把模式改为eval()，接下来就是通过model，去训练测试集，得到标签，并统计正确率。

3.训练过程及可视化

和之前的一样，还是先实例化一个优化器，选择损失函数模式，实例化ResNet18，然后进行训练。

在这里由于要展示，因此先对损失值，交叉验证分数分别设置一个初始的线，通过append的方法，画出我们的损失曲线，以及交叉验证分数曲线。

通过torch.save方法存储我们的最优解。

最后通过把存储好的最优解调用起来，使用测试集，来测试最终的效果。

最终获得的交叉验证准确率89%，测试集准确率88%，损失值及交叉验证结果的图像如下：

博客等级

码龄4年

103
原创

64
点赞

454
收藏

29
粉丝

关注

私信

热门文章

分类专栏

CV 18篇
NLP 32篇
知识图谱 1篇
机器学习基础 10篇
深度学习 26篇
数据结构笔记 7篇
opencv 3篇
MySQL 4篇
Linux 3篇

展开全部收起

上一篇：: PyTorch之ResNet模块

下一篇：: PyTorch实现WGAN

最新评论

PyTorch自建数据集+可视化结果
Swayzzu: 你调试一下，打断点到这个位置看看，意思是这个地方应该是一个可迭代的对象（比如list类型之类的），但发现这个对象是个None，没法迭代
PyTorch自建数据集+可视化结果
学习成长记: 我在进行数据集导入时，出现错误：TypeError Traceback (most recent call last) Cell In[7], line 1 ----> 1 train_dataset = InfrasoundDataset('dataset',256, 'train') 2 val_dataset = InfrasoundDataset('dataset',256, 'val') 3 test_dataset = InfrasoundDataset('dataset',256, 'test') Cell In[6], line 15, in InfrasoundDataset.__init__(self, root, resize, mode) 12 self.name2label[name] = len(self.name2label.keys()) 13 # print(self.name2label) 14 # 加载或创建CSV文件并存储数据 ---> 15 self.images, self.labels = self.load_csv('Raw_TIFs.csv') 17 # 取train, val, test数据集 18 if mode=='train': TypeError: cannot unpack non-iterable NoneType object。请问这个是为什么？
KBQA-Bert学习记录-CRF模型
Swayzzu: 建议调试检查下维度吧，看看是哪一行报的，然后断点打到那行，看看维度最后一个是不是10，代码预期是5
KBQA-Bert学习记录-CRF模型
qq_54412326: ValueError: expected last dimension of emissions is 5, got 10大佬，报错这个想问一下时什么问题呢
时间复杂度-主定理分析
狼堡你灰叔371: 虽然不太专业但是做题的话真是个小妙招给你点赞

大家在看

最新文章

目录

展开全部

收起

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。