论文阅读——Unified Generative Adversarial Networks for Controllable Image-to-Image Translation_riatig: reliable and imperceptible adversarial tex-CSDN博客

本文链接：https://blog.csdn.net/weixin_43575791/article/details/138472422

Unified Generative Adversarial Networks for Controllable Image-to-Image Translation

主要贡献：

提出了一种用于可控图像到图像翻译任务的统一 GAN 模型，该模型可以在野外生成具有任意姿势、大小、结构和位置的目标图像。
提出了三个新的目标函数来更好地优化所提出的 GAN 模型，即颜色损失、可控结构引导循环一致性损失和自我内容保留损失。
提出了一种高效的Fréchet ResNet Distance (FRD) 度量来评估真实图像和生成图像的相似性，这更符合人类的判断。
定性和定量结果表明，在具有四个数据集的两个具有挑战性的可控图像翻译任务（即手势到手势翻译和跨视图图像翻译）上，所提出的 GAN 模型相对于最先进的方法具有优越性。

模型：

模型
可控结构引导生成器
我们将来自源域的输入条件图像x和来自目标域的可控结构Cy输入到生成器G中并合成目标图像y = G(x, Cy) 这样，GT可控结构Cy提供了更强的监督和结构信息来指导深层网络中图像到图像的转换，而条件图像x提供了外观信息以产生最终结果y。

可控结构引导循环
在可控结构Cy的引导下，我们的生成器可以产生相应的图像y。我们同时考虑图像平移过程和图像重建过程，即从源域到目标域以及从目标域回到源域。

可控结构引导循环一致性损失

介绍了配对图像到图像翻译任务的可控结构引导循环一致性损失。这种损失保证了源图像和重建图像之间的一致性