论文阅读《Learning Unsupervised Multi-View Stereopsis via Robust Photometric Consistency》

CV科研随想录

已于 2023-12-25 14:28:33 修改

阅读量618

点赞数

分类专栏： CV顶会(刊)论文阅读文章标签：深度学习计算机视觉机器学习

于 2022-03-03 17:52:38 首次发布

本文链接：https://blog.csdn.net/weixin_40957452/article/details/123247797

版权

CV顶会(刊)论文阅读专栏收录该内容

59 篇文章 28 订阅

订阅专栏

论文地址：Learning Unsupervised Multi-View Stereopsis via Robust Photometric Consistency

一、摘要

有监督的MVS方法在模型训练时依赖于数据的标签，但获取3D几何标签的过程是困难的；为此，本文利用多个视图之间的光度一致性作为模型的监督信号；由于遮挡和视图间的光照信息不同，只使用光照一致性不足以约束模型；为此，在损失函数中增加了梯度衡量项，提升模型的鲁棒性；

二、网络结构

在这里插入图片描述
模型结构与邮件的的MVSNet相似， $M$ 张不同视角的图像经过特征提取网络得到深度特征图，使用相机内参和外参将特征warp到参考视图，接下来基于方差构建匹配代价体；将得到的匹配代价体经过3D U-Net正则化得到概率体，最后基于期望的形式预测深度图 $D_{s}$ ；

三、损失函数

自监督模型的关键点在于如何设计自监督损失来监督模型训练：得到初始深度图 $D_{s}$ 时，对于参考视图 $I_{s}$ 与源视图 $I_{v}^{m}$ ，将源视图基于预测深度图 $D_{s}$ 与相机warp到参考视图得： $I_{v}^{m}(\hat{u})$ ，在共同可视区域内，求光度一致性损失如下式所示：
$L_{\text {photo }}=\sum_{m}^{M}\left\|\left(I_{s}-\hat{I}_{s}^{m}\right) \odot V_{s}^{m}\right\|\tag{1}$
其中 $V_{s}^{m}$ 表示两个视图中公共视野中的像素集合；
为了增加模型鲁棒性，在光度一致性损失的基础上增加图像一阶导数的约束如式2所示，称之为一阶一致性损失：
$L_{\text {photo }}=\sum_{m=1}^{M}\left\|\left(I_{s}-\hat{I}_{s}\right) \odot V_{s}^{m}\right\|_{\epsilon}+\left\|\left(\nabla I_{s}-\nabla \hat{I}_{s}^{m}\right) \odot V_{s}^{m}\right\|\tag{2}$

由于图像的遮挡产生的不可视点，使用光度一致性损失来强行约束两个像素点是不合理的，为此，需要融合多个图像对之间的匹配误差图，只使用top-K (M之外的)视图来实现逐像素的光度一致性，最后的光度一致性损失如式3所示：
$L_{\text {photo }}=\sum_{u} \min _{m_{1}, \cdots m_{K} \atop m_{i} \neq m_{j}} \sum_{m_{k}} L^{m_{k}}(u) \\ \\ V_{s}^{m_{k}(u)>0}\tag{3}$
在这里插入图片描述
上面的公式表明，对于像素 $u$ ，在像素投影有效的视图中，使用最佳的K个不相交视图来计算损失。将源图像warp到参考图像视图，并计算逐像素一阶一致性损失图。然后将所有的损失图堆叠成一个三维损失体，尺寸为 $W\times H\times M$ 。对于每个像素在 $M$ 维度找到 $K$ 个最小值并将它们相加，得到像素级的一致性损失。
此外，增加结构一致性损失和平滑项损失来约束模型训练，最后的损失函数如式4所示：
$L=\sum \alpha L_{\text {photo }}+\beta L_{S S I M}+\gamma L_{S m o o t h}\tag{4}$

四、实验结果

在这里插入图片描述

CV科研随想录

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
论文阅读《Learning Unsupervised Multi-View Stereopsis via Robust Photometric Consistency》

论文地址：Learning Unsupervised Multi-View Stereopsis via Robust Photometric Consistency一、摘要有监督的MVS方法在模型训练时依赖于数据的标签，但获取3D几何标签的过程是困难的；为此，本文利用多个视图之间的光度一致性作为模型的监督信号；由于遮挡和视图间的光照信息不同，只使用光照一致性不足以约束模型；为此，在损失函数中增加了梯度衡量项，提升模型的鲁棒性；二、网络结构模型结构与邮件的的MVSNet相似，MMM 张
复制链接

扫一扫