【论文学习笔记-10】ActiveStereoNet(Google ECCV2018)主动式双目相机自监督学习立体匹配网络)
针对双目立体匹配中无监督存在着大量无纹理区域难匹配的问题,本文提出了采用主动式双目相机进行立体匹配的解决方案,本文数据集采用的是Inter Realsense D435 cemera采集,包含了双目相机和红外发射器(IR projector)用于对场景发射红外纹理以提高双目匹配精确度,但是由于采集的数据集缺乏如其它数据集一般的groundtruth,因此本文提出了一种通过双目自监督学习进行立体匹配训练的方法。
自监督训练方法
作者认为,在自监督的方法中,选择合适的loss比调试网络对结果更重要。
网络上,使用并扩展了Google 同组 ECCV2018另一篇文章StereoNet的网络结构,如图
使用这个网络的原因是它的效果很好,同时在GPU上可以达到全分辨率60HZ的速度。
首先输入左右图,通过siamise tower特征网络提取1/8分辨率的Feature Map,并计算出了一个1609012(这里应该是1/8W1/8H1/8D)的costvolume,以保证全分辨率下视差计算范围至多可达到144,可以精确计算至多离设备30cm的深度。
costvo