《Information Bottleneck Disentanglement for Identity Swapping》论文阅读

《Information Bottleneck Disentanglement for Identity Swapping》论文阅读

来源:CVPR2021

地址:https://openaccess.thecvf.com/content/CVPR2021/papers/Gao_Information_Bottleneck_Disentanglement_for_Identity_Swapping_CVPR_2021_paper.pdf

作者演讲视频:https://cloud.tencent.com/developer/article/1821014

一篇使用信息瓶颈理论来提纯人脸身份信息,最终实现人脸身份(Identity)与其他内容信息(Perception)解耦,从而可控地进行人脸身份信息交换的工作。

1 Motivation

1) 现有的人脸交换方法效果不够理想,身份信息与内容信息存在纠缠,导致人脸交换的效果不够理想;

2) 内容信息中包含了多种属性信息,进行详细的有监督属性控制较为困难;

2) 信息瓶颈理论对于信息的提纯与压缩,可以辅助解耦工作的完成。

2 Contribution

1) 使用信息瓶颈理论实现了身份信息与内容信息的进一步分离;

3) 获得了高质量和鲁棒的图像生成结果。

3 Approach

3.1 问题定义

这篇文章将用于生成合成图像的原始图像分成两部分,source图像 X s X_s Xs提供身份信息,target图像 X t X_t Xt提供内容信息,希望生成图像 Y s , t Y_{s,t} Ys,t保留 X s X_s Xs的身份,同时保留 X t X_t Xt中的内容。

理想的身份信息表征是什么样子呢?这篇文章的作者从向量空间的角度进行了说明:

对于图像的身份编码 z i d z_{id} zid z i d s z_{id}^s zids z i d t z_{id}^t zidt将会在向量空间中形成一个夹角,下图中绿色的虚线是二者夹角的角平分线。作者认为,如果合成图像较好地保留了 X s X_s Xs的身份信息,那么 z i d Y z_{id}^Y zidY将位于以 z i d s z_{id}^s zids为中心的临近区域内,如果合成图像中混合了 X s X_s Xs X t X_t Xt的身份信息,那么 z i d Y z_{id}^Y zidY将位于角平分线附近。

因此,对于合成图像 Y s , t Y_{s,t} Ys,t的身份编码 z i d Y z_{id}^Y zidY,它的优化目标是,尽可能与相近 z i d s z_{id}^s z

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值