局部聚合描述子向量(Vector of Locally Aggregated Descriptors,VLAD)是一种编码方法,被广泛应用到计算机视觉的许多课题中,例如图像检索和场景识别。
假设是
{xt∈Rd}mt=1
{
x
t
∈
R
d
}
t
=
1
m
输入的一幅图像的局部描述子向量的集合,
{di∈Rd}Ki=1
{
d
i
∈
R
d
}
i
=
1
K
是已经学习得到的码本,则该图像的VLAD编码为:
其中
vi=∑xt∈didi−xt
v
i
=
∑
x
t
∈
d
i
d
i
−
x
t
,
xt∈di
x
t
∈
d
i
表示
di
d
i
是距离
xt
x
t
最近的码字。
最终得到的VLAD编码是
Kd×1
K
d
×
1
的向量。