[ECCV2020]Self-Supervised Monocular 3D Face Reconstruction by Occlusion-Aware Multi-view Geometry

深蓝蓝蓝蓝蓝

已于 2022-04-13 00:15:21 修改

阅读量1k

点赞数

分类专栏： # 3D人脸重建论文阅读文章标签： 3d 计算机视觉深度学习

于 2022-02-05 20:18:47 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wrk226/article/details/122792828

版权

论文阅读同时被 2 个专栏收录

90 篇文章 10 订阅

订阅专栏

53 篇文章 48 订阅

订阅专栏

标题：Self-Supervised Monocular 3D Face Reconstruction by Occlusion-Aware Multi-view Geometry Consistency

链接：https://arxiv.org/pdf/2007.12494

本文主要是提出了一种从无监督的多视角图片构建3D人脸模型的方式。

作者提到现如今的无监督3D人脸重建方法要么是基于landmark做loss，要么是基于渲染后的图像做loss，但这两者都有共同的问题就是无法考虑人脸姿态的估计误差和深度误差。因此作者希望通过多视角的方式来解决这一点。

以上就是作者模型的流程，左边包括红框是作者的整体流程，红框讲的是作者如何建立多视角约束，也就是创新的部分，而右边蓝框内就是普通的基于2D landmark和渲染图像做loss的baseline。

模型整体思路其实很清晰。首先对于输入的图像，作者将他们分为了两组，一组是target view，就是主视角，所有其他的图都是source view，可以理解为参考图。先是用MGCNet对所有图提取3DMM参数，然后用解码器渲染出3D图片。另外解码器还要输出一个深度图，这是为了弥补开头提到的那个问题。另外，由于多视角会存在遮挡问题，在参考图中看到的东西可能在主视角中看不到，因此解码器还需要输出一张共视图(covisiable map)，用来选出那些主视角中也可以看得到的参考图的部分。

然后就是使用各种loss做约束来训练模型了，loss由两个部分组成，一部分是普通的2d feature loss，另一部分就是作者提出的多视角loss。

2d feature loss包含了render loss, landmark loss, identity loss和参数约束项。

多视角loss包含了：

1.排除遮挡后的顶点位置损失，即按照pose将参考图中的脸转到主视角，然后计算未遮挡部分的loss

2.同上，计算未遮挡部分的像素损失

3.同上，计算未遮挡部分的深度损失

4.计算脸转完后的landmark损失

深蓝蓝蓝蓝蓝

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。