概述
- 在Faster R-CNN中加入一个提取边缘的神经网络,也就说找候选框的工作也交给神经网络来做了。这样,目标检测的四个基本步骤(候选区域生成,特征提取,分类,位置精修)被统一到一个深度网络框架
原理
- 输入NxN的图像大小经过conv+relu+pooling卷积网络输出特征图Feature map,该feature map被共享用于后续RPN层和全连接层
- 利用rpn产生anchor bbox(anchor),该层通过softmax判断anchors属于positive或者negative,并使用bounding box regression修正anchors获得精确的proposals。
- 将RPN网络产生的anchor bbox(anchor)和在基础卷积产生的Feature map通过Roi Pooling 映射输出例如2X2的大小 ,
- 接着输出proposal的类别,再次使用bounding box regression获得检测框最终的精确位置
网络结构
- Region Proposal Networks
RPN作用:在基础卷积得到的feature maps相当映射滑动窗口,滑动窗口为每一个像素都配备这9种不同比例的anchors作为初始的检测框。也就是每一个滑动窗口的位置,同时预测9个区域建议,同时输出每个建议框是目标/非目标的估计概率,这样做获得检测框很不准确,所以在网络架构中有bounding box regression可以修正检测框位置
优缺点
- 优点:提出RPN网络
- 缺点:小目标检测效果不好