Unsupervised Learning of Stereo Matching

最新推荐文章于 2023-11-25 23:12:07 发布

kasdlj

最新推荐文章于 2023-11-25 23:12:07 发布

阅读量1.8k

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lvhao92/article/details/78305715

版权

Cost-volume Computation

用对应的分支来计算cost-volume，输入即左右图像，生成cost-volume。这部分是由八个卷基层构成的双塔结构。每个层后面有normalization和Relu层。这些层对两个图像的每个块都会产生特征向量。这些特征向量再进入correlation layer，计算得到cost-volume，这个correlation层就是用的Dispnet-C中的那个correlation层。

Cost-volume Aggregation

之前的方法大多使用包边滤波器去聚合cost-volume。我们却使用图像特征网络去学习这个过程中图像的结构。这个网络从两个输入图像中提取特征。这里说的也就是correlation层后面再接一些卷积层去提取特征。

当得到图像特征之后，用联合滤波器整合cost-volume以及输入图像的颜色信息。特征以cost-volume中的每个通道数与输入的颜色信息相融合，然后再连接三个卷积层来产生最终的cost-volume。这是模仿了传统立体匹配方法中的成本聚合过程。这种学习策略更好因为它可以自适应的去找到最合适的参数，细节稍后讨论。

Disparity Prediction

经过处理过后的cos-volume，用winner-take-all的策略来产生视差映射。然而，argmax操作反向无法求，所以用一个soft argmax的操作。在每个像素求得coat-volume中的最大值的系数。

经过上述三个操作。可以直接端到端的来处理立体匹配问题了

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。