《Information Bottleneck Disentanglement for Identity Swapping》论文阅读

最新推荐文章于 2024-10-13 20:50:34 发布

巍巍微澜

最新推荐文章于 2024-10-13 20:50:34 发布

阅读量2.3k

点赞数

分类专栏： Disentanglement 生成模型文章标签：计算机视觉深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44846680/article/details/121913184

版权

《Information Bottleneck Disentanglement for Identity Swapping》论文阅读

来源：CVPR2021

地址：https://openaccess.thecvf.com/content/CVPR2021/papers/Gao_Information_Bottleneck_Disentanglement_for_Identity_Swapping_CVPR_2021_paper.pdf

作者演讲视频：https://cloud.tencent.com/developer/article/1821014

一篇使用信息瓶颈理论来提纯人脸身份信息，最终实现人脸身份（Identity）与其他内容信息（Perception）解耦，从而可控地进行人脸身份信息交换的工作。

1 Motivation

1）现有的人脸交换方法效果不够理想，身份信息与内容信息存在纠缠，导致人脸交换的效果不够理想；

2）内容信息中包含了多种属性信息，进行详细的有监督属性控制较为困难；

2）信息瓶颈理论对于信息的提纯与压缩，可以辅助解耦工作的完成。

2 Contribution

1）使用信息瓶颈理论实现了身份信息与内容信息的进一步分离；

3）获得了高质量和鲁棒的图像生成结果。

3 Approach

3.1 问题定义

这篇文章将用于生成合成图像的原始图像分成两部分，source图像 $X_s$ 提供身份信息，target图像 $X_t$ 提供内容信息，希望生成图像 $Y_{s,t}$ 保留 $X_s$ 的身份，同时保留 $X_t$ 中的内容。

理想的身份信息表征是什么样子呢？这篇文章的作者从向量空间的角度进行了说明：

对于图像的身份编码 $z_{id}$ ， $z_{id}^s$ 与 $z_{id}^t$ 将会在向量空间中形成一个夹角，下图中绿色的虚线是二者夹角的角平分线。作者认为，如果合成图像较好地保留了 $X_s$ 的身份信息，那么 $z_{id}^Y$ 将位于以 $z_{id}^s$ 为中心的临近区域内，如果合成图像中混合了 $X_s$ 与 $X_t$ 的身份信息，那么 $z_{id}^Y$ 将位于角平分线附近。

因此，对于合成图像 $Y_{s,t}$ 的身份编码 $z_{id}^Y$ ，它的优化目标是，尽可能与相近 $z_{id}^s$

最低0.47元/天解锁文章

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。