新的换脸模型FaceShifter论文解读

最新推荐文章于 2024-08-16 08:57:30 发布

summer_wbb

最新推荐文章于 2024-08-16 08:57:30 发布

阅读量1.8k

点赞数

分类专栏： CVPR阅读文章标签：计算机视觉

本文链接：https://blog.csdn.net/weixin_41605888/article/details/111039528

版权

本文介绍了FaceShifter模型，一个两阶段的换脸模型，包括自适应嵌入集成网络(AEI-Net)和启发式错误察觉网络(HEAR-Net)。AEI-Net通过AAD层自适应地融合多维度特征，生成高保真度人脸，而HEAR-Net用于修复遮挡部分。实验表明模型在处理面部遮挡和生成逼真图像方面表现出色。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

论文地址：https://arxiv.org/pdf/1912.13457.pdf

前言

本文介绍了一种pipline模型, 用以抽取多维度的图片特征信息, 并自适应的完成FaceSwap任务. 整体模型分类两个部分, 第一部分基于AAD(Adaptive Attentional Denormalization, 自适应的注意力非正规化层)构建, 用以生成高保真度的Face Swapping图片; 第二部分则是名为HEAR-Net(Heuristic Error Acknowledging Refinement Network, 启发式错误察觉网络), 其作用为采用一个非常有效的trick解决换脸过程中的面部遮挡问题. 模型的两个部分所解决的问题即构成了论文的卖点: 生成高保真度的, 并且可处理面部遮挡的换脸图片.

Face Swapping的研究脉络可大略的分为三部分, 首先是最早的replacement-based works, 简单的对像素进行一一替换, 这显然对图片的角度和人的姿势要求很高. 之后一些3D-based works使用3D模型来处理图片的姿势问题, 这些模型在推断人脸的纹理, 重建人物肖像的时候非常有效, 但在执行Face Swap时又几乎不会考虑图片之间的素材差距, 比如面部的遮挡, 周围的打光和图像风格等; 也有一些工作收集了大量数据用于监督方式的遮挡识别, 但是模型很容易识别不出它从未见过的遮挡类型. 最后就是近年来的进步, 使用GAN来提升图片质量, 著名的DeepFakes就是一个代表作, 但DeepFakes只能处理特定数据之间的脸部交换; 因此后续的不可知face swapping提出了, 比如RSGAN, IPGAN, FSGAN等. 作者提出, 这些形形色色的GAN都不能自适应的进行特征融合, 因此往往结

最低0.47元/天解锁文章