【论文学习笔记-14】Bilateral Grid Learning for Stereo Matching Networks
Main Contribution
提出了一个基于双边网格的保边的cost volume上采样,主要的计算在低分辨率下进行,可以保持高速度,同时精度高。
Method
关键模块是Cost volume Upsampling in Bilateral Grid(CUBG)module,该模块输入一个低分辨率的Cost volume,先经过一个四维的双边滤波,然后通过Feature map的2d切片对每个通道进行guide并上采样为原分辨率。
本文将该模块加入了GCNet,PSMNet,GANet和DeepPrunerFast的CostVolume中对低分辨率Cost Volume进行上采样,其它模块不变。
本文基于CUBG提出了BGNet
特征提取:前三层ks = 3*3,stride为2,1,1的卷积;然后接四个残差快,stride为1,2,2,1。得到1/8分辨率;之后接一个沙漏结构获扩大感受野。最后所有1/8分辨率的feature拼在一起,得到352通道的特征。
Cost Aggregation
使用group-wise correlation,将特征分为N组,每组之间算内积相似度,N=44(组),最后得到BDNHW的costvolume。随后通过一个沙漏结构和两层3D卷积降低N的数量:44->16。之后通过一个U-Net结构的3D卷积网络进行Cost Aggregation。得到低分辨率的Cost Volume。
最后原分辨率的Cost Volume通过Soft argmin获得视差预测图。loss为L1 loss。