Rich feature hierarchies for accurate object detection and semantic segmentation（R-CNN，2013）论文笔记

最新推荐文章于 2024-04-18 23:00:13 发布

qq_32751937

最新推荐文章于 2024-04-18 23:00:13 发布

阅读量252

点赞数

分类专栏：论文阅读笔记文章标签： R-CNN 论文笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_32751937/article/details/95367987

版权

Rich feature hierarchies for accurate object detection and semantic segmentation原文链接

R-CNN阅读笔记

一、解决问题
二、解决方法
三、本人曾经忽视的细节
- （一）卷积网络和SVM的训练过程
（二）Bounding-box回归

一、解决问题

2012年，Krizhevsky等人在ImageNet大规模视觉识别挑战赛(ILSVRC)上的表现出色（AlexNet）。
那么ImageNet上的CNN分类结果在何种程度上能够应用到PASCAL VOC挑战的物体检测任务上？
本文主要解决两个问题：
1.在候选区域上自下而上使用大型（此时的大型仅仅只是指5层的网络）卷积神经网络(CNNs)用以定位物体。
2.当带标签的训练数据不足时，先针对辅助任务进行有监督预训练，再进行特定任务的调优，就可以产生明显的性能提升。

二、解决方法

（一）问题定位

一种方法将定位作为回归问题。然而，Szegedy等人与我们并行的工作表明这种策略在实践中可能不会很好（实际上也是可以的，比如后来的YOLO系列和SSD）。另一种方法是构建一个滑动窗口检测器。

（二）解决滑动窗与感受野的矛盾

文中用于提取特征的CNN有五层，这就要求有很大的感受野，进而要求滑动窗必须很大。这样必然会导致滑动窗对目标定位不精确的问题（大的滑动窗永远无法把小物体框的严丝合缝）。那么怎么办呢？最直接的办法就是把小的滑动窗放大，使其尺寸满足卷积网络的要求。而本

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Rich feature hierarchies for accurate object detection and semantic segmentation（R-CNN，2013）论文笔记

R-CNN阅读笔记一、解决问题二、解决方法（一）问题定位（二）滑动窗与感受野的矛盾一、解决问题2012年，Krizhevsky等人在ImageNet大规模视觉识别挑战赛(ILSVRC)上的表现出色（AlexNet）。那么ImageNet上的CNN分类结果在何种程度上能够应用到PASCAL VOC挑战的物体检测任务上？本文主要关注了两个问题：1.使用深度网络定位物体和在小规模的标注数据集上...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。