生成目标proposal的快速方法,为接下来的detectors提供可能的目标区域。使用归一化的梯度分辨广义目标,需要将输入图像窗口缩放到8*8,计算64d的归一化梯度特征,之后将梯度进行二值化,进行一些简单的位运算,在voc2007上训练测试,在~1000个proposal时检出率为96.2%。
方法描述:
使用BING计算图像窗口的objectness得分,为了寻找图像中的广义目标,对预定义的量化大小的窗口进行扫描。使用线性模型
w∈R64
对每个窗口进行打分:
sl=<w,gl>
(1)
l=(i,x,y)
(2)
其中
sl
,
gl
,l,i和(x,y)分别是滤波器得分,NG特征,位置,大小和窗口位置。
最终的objectness得分是:
ol=vi⋅sl+ti
(3)
vi
和
ti
分别是量化尺寸i对应的系数和偏量。
1.归一化的梯度NG及objectness
由于闭合边界内的变化比较小,NG是分辨目标的好特征,如下图所示,船和人在颜色,形状,纹理和光照等方面有较大不同,但在NG空间二者具有较强的关联性。
2.使用NG学习objectness
使用两级级联的SVM学习窗口的objectness。
State I
使用线性SVM学习公式(1)中的单一模型w,groundtruth 和随机选取背景的NG特征分别为正负样本。
State II
使用线性SVM学习公式(3)中的
vi
和
ti
, 在尺度i评估训练图像,使用NMS后的proposal作为训练样本,将滤波器得分作为1D特征,使用训练标记检测label。
3.BING
根据Alg1,线性模型
w∈R64
可使用一系列基向量
w≈∑Nwj=1βjaj
拟合,其中
Nw
是基向量的数目,
aj∈−1,164
表示一个基向量,
βj∈R
表示对应的系数。二值化的特征b可以使用位运算完成:
<w,b>≈∑Nwj=1βj(2<a+j,b>−|b|)
<script type="math/tex" id="MathJax-Element-6460">
\approx \sum_{j=1}^{N_w} \beta_j(2
-|b|)</script>
使用BYTE值的前
Ng
二值字节拟合归一化的梯度值,64D的特征
gl
可以使用
Ng
个BING特征拟合
gl=∑Ngk=128−kbk,l
快速BING算法:
首先将BING特征
bx,y
及最后一行
rx,y
保存成一个int64 及 一个BYTE变量。其次,相邻的BING特征及对应的行存在累加的关系。如算法2所示,将
rx−1,y
右移一位,并通过或运算插入新字节
bx,y
,通过相似的运算将
bx,y−1
右移8位,丢掉不属于
bx,y
的字节,并插入新的一行
rx,y
。
(1)式中的滤波器得分可以使用下式得到: