Faster R-CNN网络结构
一、RPN
第一条线路:在原图尺度上,设置了密密麻麻的候选Anchor。然后用cnn去判断哪些Anchor是里面有目标的positive anchor,哪些是没目标的negative anchor。
feature maps每一个点都有9个anchors,同时每个anchors又有可能是positive和negative,所有这些信息都保存WxHx(9*2)大小的矩阵。通过softmax获得positive anchors,相当于初步提取了检测目标候选区域box(一般认为目标在positive anchors中)。
第二条线路:通过1 * 1 * 36的滤波器,获得每个anchor的坐标的调整量,9个anchor即获得了9 * 4个坐标(中心坐标与宽和高)
RPN输出:
大小为50 * 38 * 18的positive/negative softmax分类特征矩阵
大小为 50 * 38 * 36 的regression坐标回归特征矩阵
Proposal Layer的作用:
1、生成anchors,对所有的anchors做bbox regression回归
2、根据scores由大到小排序anchors,提取前N个anchors,即提取修正位置后的positive anc