MVSNet系列

最新推荐文章于 2024-08-09 07:54:10 发布

「已注销」

最新推荐文章于 2024-08-09 07:54:10 发布

阅读量1.1w

点赞数 8

文章标签：深度学习 pytorch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_17732497/article/details/106342263

版权

本文介绍了多图像立体重建的关键步骤，包括Rectification、Stereo matching和Triangulation，重点讨论了Cost Volume在MVSNet系列方法中的应用。从MVSNet到Cascade-MVSNet，这些方法通过深度学习提升立体匹配精度，为3D场景重建提供高效解决方案。

摘要由CSDN通过智能技术生成

MVSNet系列不完全统计

背景介绍
MVSNet(ECCV18)
DeepMVS(CVPR18)
Unsupervised MVSNet(CVPR19)
R-MVSNet(CVPR19)
Point-MVSNet(ICCV19)
P-MVSNet(ICCV2019)
MVS^2(3DV 19)
Fast-MVSNet(CVPR20)
CVP-MVSNet(CVPR20)
Cascade-MVSNet(CVPR20)
PVA-MVSNet(未投)
M^3VSNet(未投)

背景介绍

Multi-image stereo reconstruction 就是利用multiple，overlap的图像来重建3D场景，并且这些图片使用透视相机并知道内外参数。
Stereo reconstruction一般可以分成三步：

Rectification
Stereo matching
Triangulation

其中最重要的就是获得视差图，得到了视差图其实也就得到了深度图。得到视差图就是要计算左右两张图中，匹配点在对应图中的视差；最直接也是最慢的就是逐点计算对应匹配，但是实在是太耗时了，因此往往构建损失立方（cost volume）来计算视差。

cost volume就是在给定的深度中，在左右两张图极线上搜索；比如左侧的p点，在右侧的极线对应地方有D_min ~ D_max范围存在对应的正确匹配点，那么计算所有d的损失值并叠加在一起就是volume了。在最终的视差图p点的视差就是cost volume中损失最小的层（就是最匹配的）。

Cost Volume在所有MVSNet方法中都使用到了，其实是传统Multi-view Stereo、Stereo Matching和光流中借鉴过来的思想，早期的DL直接使用2D CNN预测深度但是精度都不高，自MVSNet开始使用CostVolume之后普遍接受了这种思想。

For stereo matching the labels l correspond to vectors (u, v) which define the displacement in x and y direction. In the x direction, the displacement corresponds to the disparity d (u = d) and t

最低0.47元/天解锁文章

「已注销」

关注

8
点赞
踩
100

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。