LessMore直接回归学习一个2d-3d的correspondence,把DSAC的网络改成了fcn,把DSAC里学习correspondence和打分的过程放到一个网络里联合学习。精度很高,室外20cm.
DSAC将RANSAC用到camera localization中,是一个迭代优化的过程。网络预测2d到3d的投影,四个点可以确定一个pose,采样很多组,并对每一个估计的pose打分,取打分最高的一组,继续加入新的点并重新打分,直到找到最多点匹配上的一组对应的pose。经典方法RANSAC,每次随机初始化几个点,用这一部分点拟合,然后查看有多少点符合拟合结果。最后选取最多点符合的一次。是一种通过局部匹配得到全局模型的办法,或者说局部预测,全局拟合。不可微的原因是argmax,修改成可微有两种方案,第一种是softmax,第二种是基于概率的选择。作者后来发现基于概率的选择效果比较好。
Active Search
CSL
SCoRe Forest解决了less-more(dasc++)为了丢掉3dmodel而需要进行一个depth的大概初始化的问题.将重投影误差改成了角度误差,同时引入了multi-view的损失,也尝试了学光流用的photometric loss,L1范数+0.85SSIM.使用新的loss对初始化不敏感,在没有3dmodel的情况下结果更好.
用神经网络回归3d场景坐标,加了个平滑项.然后通过学习特征点为场景坐标预测权重,最后使用ransac.
Camera Pose Voting
Structure-less Resection问题:首先基于2D-3D方法的前提是map中的3D点在2D图上是可见的,这样才能获得匹配关系进一步求解camera pose,