endernewton/tf-faster-rcnn项目研究之二：认识VOC2007数据集

最新推荐文章于 2024-07-07 16:53:36 发布

jikuibu

最新推荐文章于 2024-07-07 16:53:36 发布

阅读量473

点赞数

分类专栏：机器学习我的深度学习之路文章标签： PASCAL_VOC VOC2007 tf-faster-rcnn

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/leeyisong/article/details/92762990

版权

本文介绍了PASCAL VOC2007数据集，用于图像识别和分类的挑战，包含9963张标注图片，涉及20个类别。数据集分为训练、验证和测试部分，每个图片有Detection标签，部分有Segmentation标签。详细解析了数据集的目录结构和XML标注文件格式，并概述了ImageSets文件夹的内容，为使用tf-faster-rcnn进行目标检测提供基础。

摘要由CSDN通过智能技术生成

一、概述

PASCAL VOC为图像识别和分类提供了一整套标准化的优秀的数据集，从2005年到2012年每年都会举行一场图像识别challenge。该challenge主要包括三类任务：分类（classification），检测（detection），和分割（segmentation）

这是一个监督学习的问题，训练集以带标签的图片的形式给出。这些物体包括20类：

Person: person
Animal: bird, cat, cow, dog, horse, sheep
Vehicle: aeroplane, bicycle, boat, bus, car, motorbike, train
Indoor: bottle, chair, dining table, potted plant, sofa, tv/monitor

该挑战主要包括三类任务：分类（classification），检测（detection），和分割（segmentation）所有的标注图片都有Detection需要的label，但只有部分数据有Segmentation Label。
VOC2007中包含9963张标注过的图片，由train/val/test三部分组成，共标注出24,640个物体。

VOC 2012 是VOC 2007 数据集的升级版，一共有11530张图片，每张图片都有标注，标注的物体包括人、动物（如猫、狗、岛等）、交通工具（如车、船飞机等）、家具（如椅子、桌子、沙发等）在内的20 个类别。

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
endernewton/tf-faster-rcnn项目研究之二：认识VOC2007数据集

一、概述 PASCAL VOC为图像识别和分类提供了一整套标准化的优秀的数据集，从2005年到2012年每年都会举行一场图像识别challenge。该challenge主要包括三类任务：分类（classification），检测（detection），和分割（segmentation）这是一个监督学习的问题，训练集以带标签的图片的形式给出。这些物体包括20类：...
复制链接

扫一扫

专栏目录

jikuibu CSDN认证博客专家 CSDN认证企业博客

码龄9年

32: 原创

8万+: 周排名

179万+: 总排名

5万+: 访问

: 等级

911: 积分

11: 粉丝

34: 获赞

7: 评论

95: 收藏

私信

关注

热门文章

分类专栏

最新评论

endernewton/tf-faster-rcnn项目研究之一：项目部署（GPU版）
huiye丶666: ③tensorboard --logdir=tensorboard/vgg16/voc_2007_trainval/ --port=7001 & 会出现终端给出的网址，在浏览器打不开的问题命令改为tensorboard --logdir=tensorboard/vgg16/voc_2007_trainval/default --host=本地ip，再次尝试，即可打开。本地ip怎么查：ifconfig（我所说的补充全部位于ubuntu系统下）
endernewton/tf-faster-rcnn项目研究之一：项目部署（GPU版）
huiye丶666: 补充：①coco/PythonAPI 在make前一定要补上 python setup.py install，然后再make ②使用预训练resnet101模型测试时报错（要在运行前先改正，运行了报错以后再改正之后程序就要走if else 的else了，和源代码想走的if是不一样的）错误： ~/xxx/tf-faster-rcnn/lib/datasets/voc_eval.py line122,in voc_eval pickle.dump(recs,f) TypeError: writh() argument must be str,not bytes 原因：python 以r（读）方式open文件时，python2默认是二进制读，但是到了python3，如果还用r，则会报错，改为rb（b的意思是以二进制方式读）；同理，写也是一样的。改正方法：打开tf-faster-rcnn/lib/datasets/voc_eval.py 找到line122，没记错的话，第121行那个open里面只有r，把它改为rb
endernewton/tf-faster-rcnn项目研究之三：项目的代码结构及网络原理
胖胖大海: “通过ground truth标定框与anchor之间的差异（就是两个框中心点、宽、高的差值）来回归学习，从而使得rpn层的权重参数得到逐步调整，进而使得anchor与ground truth标定框逼近重合”。个人理解，在bounding box边框回归中，应该是将ground truth与anchor之间的差异作为监督信号，reg分支预测结果和anchor之间的差异作为被监督信号，训练目的是使预测结果逐渐逼近ground truth,anchor的坐标从头至尾应该都是不变的，参照论文公式（1）、（2）
endernewton/tf-faster-rcnn项目研究之一：项目部署（GPU版）
smileaqing: 您好，请问您尝试过不使用预训练的权重从头训练这个网络过吗？
endernewton/tf-faster-rcnn项目研究之一：项目部署（GPU版）
大雷哥～回复 zx741330608: 老哥能发个源码吗，我有点问题，695455266@qq.comqq.com

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。