CRAFT Objects from Images

最新推荐文章于 2020-12-21 18:57:26 发布

王小胖儿

最新推荐文章于 2020-12-21 18:57:26 发布

阅读量1.2k

点赞数

分类专栏：目标检测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_37717568/article/details/73163131

版权

本文详细介绍了CRAFT论文中提出的目标检测方法，通过级联的proposal生成和object分类结构，提高了检测的精确度。RPN与FRCN的级联使用提升了proposal的质量，而级联的分类结构则利用了类间和类内的差异，通过多阶段训练和优化，实现了在PASCAL VOC和ILSVRC数据集上的优秀表现。

摘要由CSDN通过智能技术生成

《CRAFT Objects from Images》 2016年发表在CVPR上，对于目标检测问题，将网络结构进行了进一步的改进。

目标检测任务通常分为两个子任务：产生proposals以及将proposals分类。

在本文中，作者将两个子任务进一步细分，分别提高精度，以达到提高精确率的目的。

整体框图如下：

1. 级联的proposal生成结构

理想的proposal生成器应该产生尽量少的proposal，却能覆盖尽量多的目标实例。

由于pooling造成的分辨率损失，以及固定比例的滑动窗口，RPN在处理不同尺度不同比例的物体上仍有不足。

为了观察RPN的效果，作者基于VGG_M，使用PASCAL VOC 2007 train+val训练了RPN网络。在PASCAL VOC 2007 test上进行测试，每张图像产生300个proposals，IoU=0.5，整体的召回率达到94.87%。但在每一个类上的召回率大有不同：

其中召回率低于平均值的类别被highlight。

可以发现：1. object的比例不同、尺度不同的类别难检测（boat、bottle）

2. 外观复杂度较低、有遮挡的类别难检测（plant、tv、chair）

为了改善RPN提取的proposals质量，提出级联的结构，即RPN级联FRCN，用RPN的输出训练FRCN：

其中RPN提取一般的图案，如纹理。FRCN学到更加细致的图案。

分别训练RPN、FRCN网络。RPN网络训练后，每张训练图像上生成2000个初始proposals。用这些proposals训练FRCN网络。

训练时，positive和negative的设定与RPN相同：和任意groundTruth的IoU大于0.7视为positive；和所有groundTruth的IoU小于0.3视为negative。

测试时，RPN生成2000个初始proposals，输入到FRCN，通过合适的阈值抑制策略，可以获得小于300个proposals。这些proposals包含背景的信息更少了，而且不同来源的proposals可以整合输入，从而利用互补信息。

为什么不级联两个RPN网络？因为FRCN能够处理更难的分类问题。

2. 级联的object分类结构

分类任务需要特征能够提取到类间、类内的差异。

在Fast R-CNN中，通过softmax，分类器可以获得多类别的交叉熵损失。

多类别的交叉熵损失能够学习到丰富的类间差异，而在获取类内差异方面较弱。

Fast R-CNN的实验表明，最终检测中，错误分类是一个很大的问题。

Fast R-CNN舍弃了R-CNN中one-vs-rest SVM（训练时依次把某个类别的样本归为一类,其他剩余的样本归为另一类，这样k个类别的样本就构造出了k个SVM。分类时将未知样本分类为具有最大分类函数值的那类）。在本文中，重新应用这种形式。

最低0.47元/天解锁文章

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
CRAFT Objects from Images

《CRAFT Objects from Images》 2016年发表在CVPR上，对于目标检测问题，将RCNN网络结构进行了进一步的改进。目标检测任务通常分为两个子任务：产生proposals以及将proposals分类。在本文中，作者将两个子任务进一步细分，分别提高精度，以达到提高精确率的目的。整体框图如下： 1.
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。