Faster-RCNN中的RPN结构
最近在看目标检测的相关论文,最近的一篇是faster-RCNN,faster-RCNN相对于fast-CNN来说,将原来通过区域搜索得到的resion proposal模块让神经网络来做,在faster-RCNN中,这个部分叫做RPN(region proposal network),一开始对于这部分有所疑惑,今天看到友人写的一篇博客。茅塞顿开,在此写下自己的理解,以备查阅:
RPN的网络结构是:前一部分是用VGG网络的第五层卷积网络之后加入了一个3*3的卷积层,首先,经过五层卷积之后,feature map的大小变为原图的1/16;也就是说。原图1000*600,经过VGGNet的五层卷积之后,变成了60*40大小的feature map,对于这个feature map上的每个点,按照不同的长宽比,选取9个尺度的框(anchor),那么对于一张feature map 就有60*40*9个anchor,也就是60*40*9个候选区域了
收藏网址:
CNN目标检测(一):Faster RCNN详解
Faster RCNN github:https://github.com/rbgirshick/py-faster-rcnn
Faster RCNN:paper:https://arxivorg/abs/1506.01497
faster-rcnn中,对RPN的理解
Spatial pyramid pooling (SPP)-net (空间金字塔池化)笔记
faster rcnn中rpn的anchor,sliding windows,proposals?
目标检测博大精深,我要好好修炼