Abstract
应用端到端的框架,从粗到细的层次上递增地搜索对应关系。由于高分辨率立体数据集相对较少,我们引入了一个包含高分辨率立体对的数据集,用于训练和评估。
Motivation
1.立体匹配中的误差随深度的增加呈二次曲线增加,提供更高的分辨率可以带来更好的预估。
但是高分辨率带来运行时间和内存开销的增加过大。
2.对于缩小比例的图像可以得到更快的运行速度,但是预测的结果模糊且对远场的视差估计不准确。
3.目前的SOTA算法在高分辨率数据集上表现不佳,主要原因是架构的不足和高分辨率数据集的缺失。
Core idea
模型以从粗略到精细的方式推理,粗分辨率图像用于估计较大的差异,然后用于bias/pre-warp 细化尺度视差预估。虽然效率很高,但粗略到精细的方法在粗略分辨下匹配薄结构时效果较差 ,因为低分辨率下这些结果会消失。而我们的模型计算一个由粗到精的特征量解码器,该特征量逐渐增加分辨率。至关重要的是,初始的粗略特征量可以在整个pipeline完成前生成大物体视差的粗略预估,这允许这网络可以按需生成近距离物体的报告,这对于实时快速导航至关重要。
实施方法
关键部分:1)高效的分层立体匹配体系结构,2)一套新颖的非对称增强技术,以及3)用于训练的高分辨率合成数据集。
设计分层网络的核心思想是:在提取多尺度特征的同时&