[ICCV2019]Photo-Realistic Facial Details Synthesis From Single Image

深蓝蓝蓝蓝蓝

已于 2022-04-13 10:29:26 修改

阅读量1.2k

点赞数 1

分类专栏： # 3D人脸重建论文阅读文章标签：深度学习人工智能计算机视觉

于 2022-01-28 19:47:28 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wrk226/article/details/122734823

版权

论文阅读同时被 2 个专栏收录

90 篇文章

订阅专栏

53 篇文章

订阅专栏

本文介绍一种从单一2D图像合成高精度3D面部细节的方法，利用表情语义信息提升模型表现，并通过DeepFacialDetailNet网络实现精细化建模。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

标题：Photo-Realistic Facial Details Synthesis From Single Image

链接：https://arxiv.org/pdf/1903.10873

这篇文章要处理的问题是对输入的2D图片进行高精度3D建模。

文章的亮点在于引入了表情的语义信息，也即FACS。

特征表示与学习

首先，作者使用的是BFM模型，也即使用shape, expression,albedo构建3DMM模型的方式。

shape和expression都是先通过基于landmark的损失来估计。

然后作者考虑到landmark无法区分一些相似的表情，因此引入FACS为模型提供表情语义信息。为了做到这一点，作者首先在affectnet上训练了一个表情识别器，输入一张图片，可以输出一组情绪向量。然后作者随机采样了一堆表情参数输入可微渲染器，从而生成一堆不同表情下的2D图片。然后将生成的2D图片输入表情识别器，得到情绪向量。再输入一个预测FACS的模型得到appearance特征向量，然后将appearance特征向量与情绪向量拼接，成为最后的语义向量。最后构建一个字典，包含了从语义向量到表情向量的映射。这样的效果就是说当我们有一个图片的时候就可以直接输入表情识别器来直接获得他的语义向量，然后查字典得到对应的表情向量了。

建模

然后就是如何进行精细的建模，这里作者提出了一个Deep Facial Detail Net (DFDN)结构，包含两个auto encoder。

第一个AE的输入是图像，预测的目标是displacement map的PCA表示，这样可以让模型学到一个比较粗糙的特征。

然后第二个AE就是进一步优化之前的表示，本质上是一个GAN的结构，generator就是这个AE，输入是随机变量+图像，而输出就是一个displacement map。discriminator的目标就是帮助generator生成更真实的displacement map。

参考链接：ICCV 2019 Oral | 三维"ZAO"脸，单张图片估计人脸几何，效果堪比真实皮肤_我爱计算机视觉-CSDN博客

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。