题目:MultiRes-NetVLAD: Augmenting Place Recognition Training With Low-Resolution Imagery
团队: Queensland University of Technology
解决的问题:1.使用低分辨率图像金字塔编码来增强NetVLAD表示学习,从而获得更丰富的位置表示。
2.避免了在最近的多尺度方法中对多个patch进行拼接或求和的需要。
创新点:1.提出了一种新的多分辨率特征残差聚合方法
2.图像编码器可适应不同的特征聚合策略,适用于视点一致和视点变化数据集,从而实现最先进的召回性能
新的概念:1.对多个patch(图像块)进行拼接或求和:
2.通过在全局描述符中引入多尺度信息来提高基于单幅图像的位置描述的鲁棒性
3.图像金字塔编码:是由一幅图像的多个不同分辨率的子图构成的图像集合。是通过一个图像不断的降低采样率产生的,最小的图像可能仅仅有一个像素点
4.召回性能:recall performance:就是查出来的正确的数量除以所有正确的数量;
5.使用多个图像分辨率:分辨率就是存储的信息量,每英寸的像素数;像素:体素(voxel)、纹素(texel)和曲面元素(surfel)水平方向的像素数×垂直方向的的像素数就是分辨率,分辨率越高像素越多越清晰
6.多尺度特征/multiple scales:可以简单理解为不同尺寸的图像
7.Global compact descriptors全局紧凑描述符
代码:https: //github.com/Ahmedest61/MultiRes-NetVLAD
效果:1.增加测试时间对图像分辨率变化的鲁棒性
2.多分辨率配置的覆盖和密度的影响
3.使用不同的低分辨率图像的训练策略的消融