论文阅读EfficientNeighbourhood Consensus Networks via Submanifold Sparse Convolutions

ECCV2020 作者(Inria+ENS计算机科学系+DEEPMIND)

Background

先检测再匹配:SIFT在光照变化的情况下受限;基于学习的对光照变化改进很多,但是对于相机视点问题还不够,尤其是使用局部特征的方法,外观变化大时漏检

对图像进行稠密的特征提取可以克服上述问题,但是属于内存密集型的(内存占用),定位不够准确(分辨率的问题,低分辨率下一个点对应原图的一个格子)

Motivation

NCNet:存储量大、推理时间长、对应点的定位准确度差

Idea

原来NCNet使用的全部可能对应点,改为使用稀疏的correlation(子流形稀疏卷积)

使用一个两阶段重定位过程(guided search)

Method

Stage 1:

  • 稠密特征提取

  • 特征匹配:相比于原始NCNet计算了所有像素的correlation并存储,本文为每个像素选取TOP K个匹配对,为了让得到的correlation对输入图像的顺序具有不变性,得到的稀疏correlation有A-B和B-A两个单边相加(H×W×H×W->H×W×2×K)是对取最高得分和取全部匹配的一个折中,提高速度的同时保持了低的存储量。

  • 过滤correlation map:通过一个稀疏的转置不变CNN网络(由两个4D的CNN组成),转置(改变特征的前两维和后两维顺序),使得输出不受输入图片顺序影响

  • 获得匹配对:取correlation最大值

Stage2:重定位(hard relocalisation+softrelocalisation)

通过Sparse-NCNet在H×W得到粗匹配,指导获得2倍分辨率下的准确定位。

讲输入图像上采样得到2倍分辨率下的图像,输入到CNN获得特征图,下采样得到原始尺寸的特征图,输入得到stage1的结果。找到2倍分辨率中对应的匹配位置

  • Hard-relocalisation:((I,j),(k,l))->((2i,2j),(2k,2l)),在2倍分辨率图中找到对应点周围的局部块2×2

计算两图中局部块的匹配,找到最大的点,得到偏移量

  • soft-relocalisation:形成新的局部块3×3,通过对块内的匹配计算加权匹配,得到新的偏移量,算出最终匹配

Experiment

在数据集HPatches和InLOC以及Aachen Day-Night上测试

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值