检测数据集分析VOC+COCO_RGBD

本文介绍了VOC数据集的构成,包括JPEGImages、Annotations、ImageSets等,强调其20类物体识别。同时,对比COCO数据集的高难度特点,如小目标多、多目标分布。还提到了COCO的数据量、80个类别和应用场景。最后,简述了RGB-D数据集,包括300类家庭物品、同步RGB和深度图像以及姿态信息,适用于场景理解和物体检测研究。
摘要由CSDN通过智能技术生成

VOC数据集:(包含5个文件夹)

JPEGImages包含PASCAL VOC所提供的所有图片信息,包括训练图片和测试图片,以"年份_编号.jpg"格式命名.横向图尺寸大约在500*375左右,纵向图尺寸大约在375*500左右,基本偏差不会超过100,因为训练的第一步就是将图片resize到300*300或者500*500.

Annotations存放的是xml格式的标签文件,每个文件都对应JPEGImages文件夹的一张图片

ImageSets存放的是每一种类型的challenge对应的图像数据.其中Action下存放的是人的动作(例如running、jumping等等,这也是VOC challenge的一部分)

Layout下存放的是具有人体部位的数据(人的head、hand、feet等等,这也是VOC challenge的一部分)Main下存放的是图像物体识别的数据,总共分为20类。
  • 1
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值