Faster RCNN学习笔记
一、资源介绍
Faster R-CNN是对Fast R-CNN的改进,paper可以参考点击打开链接。
Fast R-CNN和R-CNN在前两篇博客中都已经有了详细的分析。
这里简单回顾一下:
R-CNN将图像提取ROI,将所有的ROI都放入CNN中,通过SVM得到每一个ROI的分类,第二部将每一个ROI做bounding-box的回归,得到最终的检测目标分类以及位置。
Fast R-CNN在R-CNN的基础上进行了改进,把整个图片作为CNN的输入,ROI在CNN得到的conv feature map中寻找映射到的patch,同时把SVM分类换成了Softmax分类并且和bounding-box回归一起进行SGD。在速度上得到了很大的改进。
卷积神经网络运算的时间已经大大缩短了,但是产生region proposal的时间却成为了一个瓶颈。
Faster R-CNN对于region proposal的产生提出了一种新的算法,称为RPN(region proposal network),可以大大降低以前用selective search产生ROI所用的时间。在卷积层之后加入RPN,利用RPN产生的region proposal会继续输入到ROI pooling层中,之后的步骤和Fast R-CNN中的类似,产生分类以及bounding-box的回归。
大致过程如下:
<