MVSTER: Epipolar Transformer for EfficientMulti-View Stereo
MVSTER网络结构如图所示。给定参考图像及其对应的源图像,首先利用特征金字塔网络提取2D多尺度特征。然后将源图像特征变化到参考摄像机坐标系下,通过可微单应性构造源体(Sec. 3.1)。随后,利用极线Transformer聚合源体并产生代价体,辅助分支进行单目深度估计以增强上下文。该体由轻量级3D CNN正则化以进行深度估计(Sec. 3.2)。进一步以级联结构构建,以粗到细的方式传播深度图 (Sec. 3.3).。
原创
2023-12-26 13:31:44 ·
883 阅读 ·
1 评论