Faster R-CNN结构
Faster R-CNN创新点
RPN(区域选择网络)
从下到上简单说下,先是卷积提取特征,最后将得到特征图,进行分类(有目标和没有目标)和回归(候选框的中心坐标,以及长宽)
最右侧的是我们的anchor,它是根据候选框的中心坐标以及长宽,等比例的放大。这里用的9个anchor
这里的K也就是我们的anchor的个数,所以这个对每一框都有打分,从中选择最好的那一个。
详细见RPN计算流程
anchor
RPN计算流程
代价函数
总公式:
首先,这是一个分类的损失函数。
p i ∗ p^*_i pi∗为1/0,根据是否IOU>=0.5取得,为1也就是框到目标。
p i p_i pi为预测的概率。
最后就是损失函数的表达式。
这是回归的损失函数。让框更好的框到目标。损失函数见上面总公式的最右边。
ground truth也就是我们标注的数据。这里的 p i ∗ p^*_i pi∗就不多说了,有目标才对框回归求最最佳框。
这里的回归公式的 t i , t i ∗ t_i,t^*_i ti,ti∗,计算的过程在上图的右半部分:
这几个框的关系呢,真实标注框(顾名思义就是我们标注的),
anchor box也就是我们上面讲到的使用RPN生成的框,
这个预测框呢就是我们将要输出的框,这个预测框的效果呢就是跟真实框接近。
Faster R-CNN 训练
Faster R-CNN结果