自己写dataloader，pytorch数据集读取，resnet50在standford cars数据集上

最新推荐文章于 2024-05-06 14:34:04 发布

纶巾

最新推荐文章于 2024-05-06 14:34:04 发布

阅读量3.5k

点赞数 4

分类专栏： pytorch

本文链接：https://blog.csdn.net/WWWWWWGJ/article/details/88805432

版权

本文介绍了如何利用ResNet50模型在Stanford Cars数据集上进行训练。该数据集包含196类车辆图像，共16185张，分为训练集和测试集。作者提供了读取MAT文件、转换为TXT标签以及编写自定义dataloader的代码，并指出在没有验证集的情况下，相关代码应进行注释。尽管使用GPU可以提升训练效率，但作者发现模型训练后的准确率并不理想。

摘要由CSDN通过智能技术生成

作者用resnet50跑了一下standford cars数据集。该数据集共有196类，16185张图片，其中训练集有8144张，测试集有8041张图片。

训练集是这样的：

train/00001.jpg

train/00002.jpg

……

对应的标签放在另一个mat文件中。

读取mat文件的代码如下，将其写进txt文件，一行只有一个正整数，表示对应的一个标签

import scipy.io

data = scipy.io.loadmat('cars_train_annos.mat')
annotations = data['annotations']
f_train = open('./train.txt','w')

for i in range(annotations.shape[1]):
    num = int(annotations[0,i][4])
    num = str(num)
    print(i,num)
    f_train.write(num+'\n')

f_train.close()

有了图像和对应的标签之后，就可以开始写dataloader类了，代码如下：

import torch
import torch.nn as nn
import torch.optim as optim
from torch.optim import lr_scheduler
from torch.autograd import Variable

from torch.utils.data import Dataset
from torchvision import models,transforms
import os
import time

from PIL import Image


# use PIL Image to read iamge
def default_loader(path):
    try:
        img = Image.open(path)
        return img.convert('RGB')
    except:
        print("Cannot read image:{}".format(path))


class customData(Dataset):
    def __init__(self,img_path,txt_path,dataset='',data_transforms=None,loader=default_loader):
        with open(txt_path) as input_file:
            lines = input_file.readlines()
            self.img_label = [int(line.strip()) for line in lines]
        self.img_name = []
        for root,dirs,files in os.walk(img_path):
            for name in sorted(files):
                self.img_name.append(os.path.join(img_path,name))
        self.data_transforms = data_transforms
        self.dataset = dataset
        self.loader = loader
        # 最主要的是将图片路径存入self.img_name,将对应的标签写入sel

最低0.47元/天解锁文章

纶巾

关注

4
点赞
踩
19

收藏

觉得还不错? 一键收藏
3
评论
自己写dataloader，pytorch数据集读取，resnet50在standford cars数据集上

作者用resnet50跑了一下standford cars数据集。该数据集共有196类，16185张图片，其中训练集有8144张，测试集有8041张图片。训练集是这样的： train/00001.jpg train/00002.jpg ……对应的标签放在另一个mat文件中。读取mat文件的代码如下，将其写进txt文件，一行只有一...
复制链接

扫一扫

专栏目录