1. Faster R-CNN
Faster R-CNN是一种端到端的多任务卷积神经网络,能够同时完成目标检测和类型识别的任务。它由a)主干网络,b)建议区域网络(RPN :Region Proposal Network),和c)分类与回归网络三部分组成。其中主干网络是特征提取器,它提取出的图像特征,被RPN网络,分类与回归网络共享。RPN通过边界坐标回归和二分类双分支结构,初步找出包含目标的前景区域。分类与回归网络对包含目标的特征区域进行精细处理,输出目标的坐标信息和类别标签。Faster R-CNN的网络结构如图1所示:
图1
1.1 RPN
RPN网络对主干网络输出的feature map进行处理,产生多个可能含有目标的建议区域。它由两个卷积分支构成,其中一个分支通过对坐标的回归,定位目标在图片中的大概位置,另一个分支通过二分类处理,找出包含目标的前景区域。RPN的网络结构如图2所示: