Pyramid Stereo Matching Network

10 篇文章 0 订阅

参照文章:https://zhuanlan.zhihu.com/p/52641036
在这里插入图片描述

立体匹配这边左右视图提取特征的网络都是共享权重的。SPP模块可以从左下方看到,就是四个不同尺度的池化,再上采样串联起来,其实就是整合多尺度的信息。送到cost volume之前左右图的特征是(1,32,96,312)维度的(连着两个乘号会把中间的加粗…行吧),32是通道数,96*312是输入图像分辨率的1/4,1是batch size,后面的cost volume的1也是这个,就不管了。cost volume的维度是(1,64,48,96,312),64的前32个通道是左视图的,后32个通道是右视图的;48代表视差等级的维度,即视差为0-47px(设置最大视差为191px,后面会上采样)。贴一下形成cost volume这部分的代码,比如现在i=10,即cost volume的第三个维度视差为10px时,第二个维度的前32个通道取左图x轴上10以后的像素,后32个通道取右图x轴上去掉最后10像素的所有,其他地方都是0(截图没截出来)。

得到cost volume之后就是一大堆3D卷积(Stacked hourglass的结构比Basic效果好,反正谁复杂谁强呗…),可以看到右下方有bilinear和regression模块,就是将低分辨率、低视差等级的图插值为(D,H,W)维度的,然后用softmax作用于所有视差等级求出各个视差的概率,加权得到最终各个像素点的视差,即H*W的视差图。

整个论文 就是给定两个不同视角left , right, 算出disparity map, 这样就可以根据stereo pair算出深度
怎么算? 见introduction
在这里插入图片描述

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值