零基础入门CV赛事-Task2 数据读取与数据扩增

最新推荐文章于 2024-09-21 17:56:48 发布

qq_36818174

最新推荐文章于 2024-09-21 17:56:48 发布

阅读量132

点赞数

分类专栏：图像识别文章标签： python 人工智能

本文链接：https://blog.csdn.net/qq_36818174/article/details/106262212

版权

图像识别专栏收录该内容

6 篇文章 0 订阅

订阅专栏

1. 目的

实现图片的数据读取与数据扩增和Pytorch读取赛题数据

2. 学习目标

学习Python和Pytorch中图像读取
学会扩增方法和Pytorch读取赛题数据

3.图像读取技术

学习使用Pillow和OpenCV进行图像读取，学习数据扩增库torchvision，学习了numpy，padans，pil三个的用法。

4.Pytorch读取数据

使用Pytorch进行数据读取代码：

import os, sys, glob, shutil, json
import cv2

from PIL import Image
import numpy as np

import torch
from torch.utils.data.dataset import Dataset
import torchvision.transforms as transforms

class SVHNDataset(Dataset):
    def __init__(self, img_path, img_label, transform=None):
        self.img_path = img_path
        self.img_label = img_label 
        if transform is not None:
            self.transform = transform
        else:
            self.transform = None

    def __getitem__(self, index):
        img = Image.open(self.img_path[index]).convert('RGB')

        if self.transform is not None:
            img = self.transform(img)
        
        # 原始SVHN中类别10为数字0
        lbl = np.array(self.img_label[index], dtype=np.int)
        lbl = list(lbl)  + (5 - len(lbl)) * [10]
        
        return img, torch.from_numpy(np.array(lbl[:5]))

    def __len__(self):
        return len(self.img_path)

train_path = glob.glob('../input/train/*.png')
train_path.sort()
train_json = json.load(open('../input/train.json'))
train_label = [train_json[x]['label'] for x in train_json]

data = SVHNDataset(train_path, train_label,
          transforms.Compose([
              # 缩放到固定尺寸
              transforms.Resize((64, 128)),

              # 随机颜色变换
              transforms.ColorJitter(0.2, 0.2, 0.2),

              # 加入随机旋转
              transforms.RandomRotation(5),

              # 将图片转换为pytorch 的tesntor
              # transforms.ToTensor(),

              # 对图像像素进行归一化
              # transforms.Normalize([0.485,0.456,0.406],[0.229,0.224,0.225])
            ]))