检测数据集分析VOC+COCO_RGBD

最新推荐文章于 2024-07-05 16:47:00 发布

记录者丸子

最新推荐文章于 2024-07-05 16:47:00 发布

阅读量7.8k

点赞数 1

分类专栏：深度学习，目标检测，智能机器人

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yuanluolvge/article/details/77989606

版权

本文介绍了VOC数据集的构成，包括JPEGImages、Annotations、ImageSets等，强调其20类物体识别。同时，对比COCO数据集的高难度特点，如小目标多、多目标分布。还提到了COCO的数据量、80个类别和应用场景。最后，简述了RGB-D数据集，包括300类家庭物品、同步RGB和深度图像以及姿态信息，适用于场景理解和物体检测研究。

摘要由CSDN通过智能技术生成

VOC数据集:(包含5个文件夹)

JPEGImages包含PASCAL VOC所提供的所有图片信息,包括训练图片和测试图片,以"年份_编号.jpg"格式命名.横向图尺寸大约在500*375左右,纵向图尺寸大约在375*500左右,基本偏差不会超过100,因为训练的第一步就是将图片resize到300*300或者500*500.

Annotations存放的是xml格式的标签文件,每个文件都对应JPEGImages文件夹的一张图片

ImageSets存放的是每一种类型的challenge对应的图像数据.其中Action下存放的是人的动作（例如running、jumping等等，这也是VOC challenge的一部分）

Layout下存放的是具有人体部位的数据（人的head、hand、feet等等，这也是VOC challenge的一部分）Main下存放的是图像物体识别的数据，总共分为20类。

最低0.47元/天解锁文章

记录者丸子

关注

1
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
检测数据集分析VOC+COCO_RGBD

VOC数据集:(包含5个文件夹)JPEGImages包含PASCAL VOC所提供的所有图片信息,包括训练图片和测试图片,以"年份_编号.jpg"格式命名.横向图尺寸大约在500*375左右,纵向图尺寸大约在375*500左右,基本偏差不会超过100,因为训练的第一步就是将图片resize到300*300或者500*500.Annotations存放的是xml格式的标签文件,每个文件都对应
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。