目标检测数据集

最新推荐文章于 2024-06-08 08:25:29 发布

暄染落墨

最新推荐文章于 2024-06-08 08:25:29 发布

阅读量572

点赞数

分类专栏：目标检测文章标签：深度学习

本文链接：https://blog.csdn.net/qq_36136196/article/details/119220313

版权

目标检测专栏收录该内容

16 篇文章 2 订阅

订阅专栏

本文介绍了如何下载并处理香蕉检测数据集，通过自定义PyTorch Dataset和DataLoader，展示了如何读取图像、标签，并进行数据预处理。关键步骤包括数据集读取、图像读取、数据集构建和Dataloader使用。

摘要由CSDN通过智能技术生成

下载数据集

%matplotlib inline
import os
import pandas as pd
import torch
import torchvision
from d2l import torch as d2l

#@save
d2l.DATA_HUB['banana-detection'] = (
    d2l.DATA_URL + 'banana-detection.zip',
    '5de26c8fce5ccdea9f91267273464dc968d20d72')

读取数据集

#@save
def read_data_bananas(is_train=True):
    """读取香蕉检测数据集中的图像和标签。"""
    data_dir = d2l.download_extract('banana-detection')
    csv_fname = os.path.join(data_dir,
                             'bananas_train' if is_train else 'bananas_val',
                             'label.csv')
    csv_data = pd.read_csv(csv_fname)
    csv_data = csv_data.set_index('img_name')
    images, targets = [], []
    for img_name, target in csv_data.iterrows():
        images.append(
            torchvision.io.read_image(
                os.path.join(data_dir,
                             'bananas_train' if is_train else 'bananas_val',
                             'images', f'{img_name}')))
        # Here `target` contains (class, upper-left x, upper-left y,
        # lower-right x, lower-right y), where all the images have the same
        # banana class (index 0)
        targets.append(list(target))
    return images, torch.tensor(targets).unsqueeze(1) / 256

自定义dataset

#@save
class BananasDataset(torch.utils.data.Dataset):
    """一个用于加载香蕉检测数据集的自定义数据集。"""
    def __init__(self, is_train):
        self.features, self.labels = read_data_bananas(is_train)
        print('read ' + str(len(self.features)) + (
            f' training examples' if is_train else f' validation examples'))

    def __getitem__(self, idx):
        return (self.features[idx].float(), self.labels[idx])

    def __len__(self):
        return len(self.features)

dataloader读取一个iteration

#@save
def load_data_bananas(batch_size):
    """加载香蕉检测数据集。"""
    train_iter = torch.utils.data.DataLoader(BananasDataset(is_train=True),
                                             batch_size, shuffle=True)
    val_iter = torch.utils.data.DataLoader(BananasDataset(is_train=False),
                                           batch_size)
    return train_iter, val_iter

示例

标签的小批量的形状为（批量大小， m ，5），5是类别，左上右下坐标，其中 m 是数据集的任何图像中边界框可能出现的最大数量，当某张图片边界框数量不够m时，填充非法边界框，将类别置为-1。

batch_size, edge_size = 32, 256
train_iter, _ = load_data_bananas(batch_size)
batch = next(iter(train_iter))
batch[0].shape, batch[1].shape # torch.Size([32, 3, 256, 256])，torch.Size([32, 1, 5]) ，中间1是边界框的个数

打印图片

imgs = (batch[0][0:10].permute(0, 2, 3, 1)) / 255 #原先是通道，宽，高->宽，高，通道
axes = d2l.show_images(imgs, 2, 5, scale=2)
for ax, label in zip(axes, batch[1][0:10]):
    d2l.show_bboxes(ax, [label[0][1:5] * edge_size], colors=['w'])

在这里插入图片描述

暄染落墨

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
4
评论
目标检测数据集

目录下载数据集读取数据集自定义datasetdataloader读取一个iteration示例打印图片下载数据集%matplotlib inlineimport osimport pandas as pdimport torchimport torchvisionfrom d2l import torch as d2l#@saved2l.DATA_HUB['banana-detection'] = ( d2l.DATA_URL + 'banana-detection.zip',
复制链接

扫一扫

专栏目录