目标检测(一)数据集处理与读取

开始

账号注册的比较晚,本来准备好好记录平时的一些有价值的问题,结果一直没写,这次为了督促自己学习,报名参加了Datawhale12月组队学习,以后会开始坚持记录,这几篇虽是打卡但尽量不限于组队学习的内容

内容参考:Datawhale Task01: 两个年轻人-目标检测基础和VOC数据集

一· VOC数据集简介

做深度学习目标检测都会接触到VOC这个数据集,一般很少用到整个数据集,但是一般都会按照它的格式准备自己的数据集。VOC数据集是目标检测领域最常用的标准数据集之一,几乎所有检测方向的论文,如faster_rcnn、yolo、SSD等都会给出其在VOC数据集上训练并评测的效果。下面是下载VOC数据集后的目录构成以及各个文件夹的内容格式:

VOC2012
├── Annotations	# 每张图片相关的标注信息,xml格式
├── ImageSets
│   ├── Layout	# train,valid,test和train+valid数据集的文件名
│   ├── Main	# 各个类别所在图片的文件名
│   └── Segmentation	# 分割所用数据集的文件名
├── JPEGImages	# 包括训练验证测试用到的所有图片   
├── SegmentationClass	# 存放语义分割相关图片
└── SegmentationObject	# 存放实例分割相关图片

如下图为Annotations中xml文件中包裹的图片标注信息
图片引用自datawhale教程

二· Dataloader的构建

torch.utils.data.dataset这样的抽象类可以用来创建数据集。因为抽象类不能实例化,因此我们需要构造这个抽象类的子类来创建数据集。类中最重要的就是len和getitem这两个函数,前者给出数据集的大小,后者是用于查找数据和标签。torch.utils.data.DataLoader是一个迭代器,方便我们去多线程地读取数据,并且可以实现batch以及shuffle的读取等。

对pytorch读取数据一般化的流程:
图像数据 ➡ 图像索引文件 ➡ 使用Dataset构建数据集 ➡ 使用DataLoader读取数据

1.对于pytorch自带的数据集

pytorch帮你下载好了数据并制作了数据标签,然后通过使用Dataset和DataLoader两个类完成了数据集的构建和读取
以MNIST 手写数字数据集为例:

train_dataset = datasets.FashionMNIST(
	root='../datasets', # 数据加载后保存的相对目录
	train=True, # 是否加载数据库的训
  • 1
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
voc 2017 目标检测数据集可以从官方网站获取。首先,我们可以通过搜索"voc 2017 目标检测数据集下载"来找到相关的网页。在网页上,我们可以找到下载链接,点击链接后,会弹出下载选项。我们可以选择保存文件,并选择一个合适的存储位置。然后,等待数据集的下载完成。 voc 2017 目标检测数据集是用于计算机视觉领域的一个重要数据集,主要用于目标检测算法的评估与研究。数据集中包含了大量真实世界的图像和对应的标记框。这些标记框用于标识图像中的不同目标物体的位置和类别信息。 下载并使用这个数据集可以帮助研究人员和开发者评估他们的目标检测算法在真实数据上的性能表现,并进行进一步的改进和优化。同时,这个数据集也可以作为教育和学习的资源,帮助初学者理解和熟悉目标检测的基本概念和方法。 下载数据集后,我们可以使用相应的工具和库来加载和处理数据集。例如,使用Python的一个开源库如OpenCV或PIL来读取图像,并根据标记框的信息来提取目标物体的特征。然后,我们可以使用机器学习或深度学习的算法来训练模型,并在数据集上进行目标检测的实验和测试。 总之,voc 2017 目标检测数据集的下载和使用是进行目标检测算法研究和实践的重要一步。它提供了丰富的真实图像和标记框,为开发者和研究人员提供了机会来探索和改进目标检测算法的性能。
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值