多视图几何三维重建实战系列- Cascade-MVSNet

最新推荐文章于 2024-09-21 19:04:32 发布

Tom Hardy

最新推荐文章于 2024-09-21 19:04:32 发布

阅读量1.1k

点赞数

文章标签：计算机视觉机器学习人工智能深度学习神经网络

本文链接：https://blog.csdn.net/qq_29462849/article/details/118159640

版权

Cascade-MVSNet通过级联代价体构造策略，解决了MVSNet在高分辨率深度估计时GPU消耗大的问题。该方法在降低GPU需求的同时，提高了深度估计精度和点云的完整性，适用于大场景的三维重建。相比于R-MVSNet，Cascade-MVSNet在保持深度估计准确性的同时，能更好地保留纹理信息。

摘要由CSDN通过智能技术生成

点击上方“计算机视觉工坊”，选择“星标”

干货第一时间送达

MVSNet在2018年提出后，在估计深度图的应用中取得了非常好的结果。应用CNN于立体匹配的技术也使得传统的匹配效率整体提高。但是因为使用3D卷积神经网络进行深度正则化处理，所以即便在比较低的分辨率（900*600）下，也需要比较高的GPU消耗。针对该问题，该团队在CVPR2019上提出利用循环神经网络对3D代价体进行切片处理，大幅度减少GPU消耗，使得该网络框架不仅可以估计更大范围的场景，且估计精度更高。

本篇文章仍将就MVSNet内存消耗大的问题，介绍CVPR2020的一篇文章：Cascade Cost Volume for High-Resolution Multi-View Stereo and Stereo Matching. 该文章沿用MVSNet深度估计的框架，具体创新在于改进Cost Volume的构造方式，使得利用深度学习估计深度时，在较低GPU消耗上估计高分辨率、大场景的深度。

1、背景介绍

基于深度学习的多视图立体，例如经典的MVSNet网络架构，通常会构造一个三维的代价体去回归场景的深度值，但MVSNet常受限于显存限制而无法对高分辨率的影像进行深度估计。

在MVSNet框架的基础上，多种方法对显存增长问题提出了改进方案，上一篇文章我们介绍了R-MVSNet，该方法利用循环神经网络GRU，对三维代价体进行切片，这样不仅保留了靠前的深度和纹理信息，也减少了GPU的消耗，深度估计精度和深度估计范围要优于MVSNet，不同方法的比较结果可通过图1体现。

图1 效果比较图

不同于R-MVSNet，本篇文章（以下简称“Cascade-MVSNet”）则仍旧使用了MVSNet网络框架中的3D卷积神经网络对深度代价体进行正则化，但不同于其代价体的构造，Cascade-MVSNet利用链式代价体构造的策略，先估计较为粗糙的深度值，然后再进一步缩小深度估计范围，提高深度估计精度，实现了在较小的GPU消耗的条件下，得到较高分辨率和较高精度的深度图，经过稠密重建后，Cascade-MVSNet的结果也比之前所提到的方法要更为完整（图2）。