Self-Supervised Learning for Stereo Matching with Self-Improving Ability
GC-Net +非监督
端到端+自监督+warp+self-improving+在线方式
五部分结构:特征提取,交叉特征卷,3d特征匹配,soft argmin,warping
1特征提取(输出H x WxF)
取代计算原始像素强度的匹配代价,我们学习提取局部特征。相似GC-net,18个卷积层,3x3卷积核,每3层跳跃连接。输出维度64,双塔结构。提取一元特征。
2特征卷构建(输出 HxWxD+1xF)
用学习的特征计算匹配代价,通过构建特征卷。连接学习的特征,在左图和右图每个视差等级组装特征卷。通过学习的特征来构建匹配代价空间,需要先对视差范围做一个确定,然后将左右特征图片concated起来,从而生成最终的特征向量。左图复制D+1份,右图平移D。然后相间的连接。
3,3d特征匹配with正则化(编码-解码结构)
学习匹配代价在每个候选视差,不仅依赖一元项同时正则化局部环境。Res-TDM模型,残差连接自顶向下,最大视差和空间位置提取更好特征,底到上,下采样到1/16原图像大小,上到底,上卷积恢复到原图像大小。每个尺度,用Res-TDM 残差块。
4soft argmin(3d转换2d)
5损失函数
一元项,视差场正则化项,一致性约束,最大深度启发式
一元项
结构相似性,图像外观差异,图像梯度差异
正则化项
总一般变化,二阶梯度
一致性项
右图像+右视差图(Dr)
左图像 +右视角+左图像(Dl+Dr)