参考:https://www.jianshu.com/p/7d48bff4d1c3
NeXtVLAD 是一个特征聚合的网络,可以在 向量空间中 提取 全局描述子特征,减少参数,提升性能。 在处理 视频音频特征聚合 时,效果甚好。
一、VLAD(局部聚类向量—提取图像特征)
这里提到的VLAD算是特征提取函数 f 的一种,可简称为 fvlad 。
VLAD的全称是Vector of Locally Aggregated Descriptors,即“局部聚集描述子向量”。顾名思义,把聚集起来的局部描述子构造成一个向量,用该向量作为图像的全局描述子。