在R-CNN中,作者应用了Bounding-box regression来改善目标的定位。
在训练中,输入是一系列的训练对{},i=1,2,…,N,其中
表示候选区域中心的坐标和宽度高度,接下来忽略P的上标i,然后用G来表示原图中每一个标好的框,G=(Gx,Gy,Gw,Gh),最终的目标是学习一个函数将P转化成G。
依据4个函数,前两个公式表示的是中心的平移,接下来的两个公式表示的是宽度和高度的尺度变化。在学习到这4个函数之后,我们可以计算出一个预测的ground-truth框
。
这些函数由候选区域经过卷积之后得到的特征向量经过线性变换得到。d*P=w*T∅5P,通过优化下面的公式来得到w。
对于每个训练对(P,G)回归函数的目标t*通过下面公式计算得到。
作为一个标准的正则化最小平方问题,这个问题可以被高效的解决。
设置λ为1000。
如果P远离所有的标记好的框,那么让P去转化G没有意义。所以,我们转化那种至少和一个标记好的框离得进的P。用Iou这个评价指标来表示P和G的近和远的程度,大于0.6就表明离得近,所有那种离得都远的框就都丢弃掉。为了学习到一系列特定类别的框,对每一个物体的类别都做一次回归。
在训练中,输入是一系列的训练对{},i=1,2,…,N,其中
表示候选区域中心的坐标和宽度高度,接下来忽略P的上标i,然后用G来表示原图中每一个标好的框,G=
,最终的目标是学习一个函数将P转化成G。
依据4个函数,前两个公式表示的是中心的平移,接下来的两个公式表示的是宽度和高度的尺度变化。在学习到这4个函数之后,我们可以计算出一个预测的ground-truth框
。
这些函数由候选区域经过卷积之后得到的特征向量经过线性变换得到。
,通过优化下面的公式来得到w。
对于每个训练对(P,G)回归函数的目标通过下面公式计算得到。
作为一个标准的正则化最小平方问题,这个问题可以被高效的解决。
设置为1000。
如果P远离所有的标记好的框,那么让P去转化G没有意义。所以,我们转化那种至少和一个标记好的框离得进的P。用Iou这个评价指标来表示P和G的近和远的程度,大于0.6就表明离得近,所有那种离得都远的框就都丢弃掉。为了学习到一系列特定类别的框,对每一个物体的类别都做一次回归。