一、VLAD
名称:Vector of Local Aggregated Descriptor
计算步骤:
- 提取SIFT描述算子
- 训练K个聚类中心的码本,k-means,所有数据
- 每个SIFT找到最近的聚类中心
- 求残差
- 残差和,然后得到k*N的向量,即为所求
二、NetVLAD
论文:https://arxiv.org/pdf/1511.07247.pdf
时间线:2016 TPAMI
主要内容:将CNN 的特征用VLAD聚合起来,用于位置检索,同时设计出可以end-to-end训练的VLAD layer
三、NextVLAD
论文:https://arxiv.org/pdf/1811.05014.pdf
时间线:2018 CVPR youtube8m chanllenge 单模型冠军
主要内容:借鉴Resnext的结构,将NetVLAD改造为NextVLAD,从而减低参数量,应用于video classification
NetVLAD
NextVLAD