python猫狗大战pytorch_Kaggle猫狗识别Pytorch详细搭建过程

最新推荐文章于 2024-06-21 15:21:12 发布

weixin_39669761

最新推荐文章于 2024-06-21 15:21:12 发布

阅读量1.3k

点赞数 1

文章标签： python猫狗大战pytorch

文章源码链接，包括Notebook和对应的Pycharm项目。求个Star！！

2020-07-18 更新：感谢 @暴走拉比指出之前的逻辑错误划分的数据加载得仍然是全部的数据，更新后自己简单的CNN网络准确率为73.56。

需求

Kaggle比赛链接 ,给出猫狗图片，然后预测图片中是狗的概率。

训练集有25,000张图片，测试集12,500 张图片。

自己最开始构思大致框架的时候的一个思维导图：

包的导入

需要注意的是将tqdm 改为tqdm.notebook，从而在notebook环境下获得更好的体验。因为导入tqdm的话，会发生进度条打印多次的情况，体验很不好

import os

import pandas as pd

from PIL import Image

import torch

from torch.utils.data import Dataset

from torchvision import transforms,models,utils

from tqdm.notebook import tqdm

# from tqdm import tqdm_notebook as tqdm

from torch import nn

import matplotlib.pyplot as plt

import torch.optim as optim

from torch.utils.tensorboard import SummaryWriter

# from torchvision import datasets, transforms,utils

相关文件路径配置，在pycharm项目中将相关路径的配置都统一放在config.py中来管理

train_path = 'D:/AIdata/dog vs cat/train'

test_path = 'D:/AIdata/dog vs cat/test1'

data_root = 'D:/AIdata/dog vs cat/'

csv_path = './submission_valnet.csv'

tensorboard_path='C:/Users/BraveY/Documents/BraveY/AI-with-code/dog-vs-cat/tensortboard'

model_save_path = 'C:/Users/BraveY/Documents/BraveY/AI-with-code/dog-vs-cat/modelDict/dogs-vs-cats-notebook.pth'

数据集的创建

因为Kaggle官方提供的是原始数据，不像之前的手写数字数据集可以从pytorch中直接下载已经处理过的数据集，可以直接将数据放入模型进行训练。因此需要我们自己实现数据集的生成。

数据集生成的总体思路是继承torch.utils.data.Dataset这个类，自己实现getitem和len这两个私有方法来完成对我们自己数据的读取操作。其中getitem这个函数的主要功能是根据样本的索引，返回索引对应的一张图片的图像数据X与对应的标签Y，也就是返回一个对应的训练样本。len这个函数的功能比较简单直接返回数据集中样本的个数即可。

具体而言，getitem的实现思路比较简单，将索引idx转换为图片的路径，然后用PIL的Image包来读取图片数据，然后将数据用torchvision的transforms转换成tensor并且进行Resize来统一大小(给出的图片尺寸不一致)与归一化，这样一来就可以得到图像数据了。因为训练集中图片的文件名上面带有猫狗的标签，所以标签可以通过对图片文件名split后得到然后转成0,1编码。

在获取标签的时候，因为官方提供的测试数据集中并没有猫狗的标签，所以测试集的标签逻辑稍有不同。我的做法是使用一个train标志来进行区分，对于测试的数据，直接将测试样本的标签变成图片自带的id，这样方便后面输出提交的csv文件。因为测试样本不用计算loss，所以将标签置为id是没问题的。

为了实现将idx索引转换成图片路径，需要在init()函数中将所有的图片路径放在一个list中，这可以用os.listdir()来实现，然后就可以根据索引去获得路径了。

需要注意的是，之所以getitem()需要根据索引来返回样本，是因为训练数据并不是一次性将所有样本数据加载到内存中，这样太耗内存。而是只用加载对应batch中的一部分数据，所以通过索引来加载送入模型中的一批数据。

class MyDataset(Dataset):

def __init__(self, data_path:str, train=True, transform=None):

self.data_path = data_path

self.train_flag = train

if transform is None:

self.transform = transforms.Compose(

[

transforms.Resize(size = (224,224)),#尺寸规范

transforms.ToTensor(), #转化为tensor

transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5)),

])

else:

self.transform = transform

self.path_list = os.listdir(data_path)

def __getitem__(self, idx: int):

# img to tensor and label to tensor

img_path = self.path_list[idx]

if self.train_flag is True:

if img_path.split('.')[0] == 'dog' :

label = 1

else:

label = 0

else:

label = int(img_path.split('.')[0]) # split 的是str类型要转换为int

label = torch.as_tensor(label, dtype=torch.int64) # 必须使用long 类型数据，否则后面训练会报错 expect long

最低0.47元/天解锁文章

weixin_39669761

关注

1
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
python猫狗大战pytorch_Kaggle猫狗识别Pytorch详细搭建过程

文章源码链接，包括Notebook和对应的Pycharm项目。求个Star！！2020-07-18 更新：感谢 @暴走拉比指出之前的逻辑错误划分的数据加载得仍然是全部的数据，更新后自己简单的CNN网络准确率为73.56。需求Kaggle比赛链接 ,给出猫狗图片，然后预测图片中是狗的概率。训练集有25,000张图片，测试集12,500 张图片。自己最开始构思大致框架的时候的一个思维导图：包的导入需...
复制链接

扫一扫