【论文题目】U-GAT-IT: Unsupervised Generative Attentional Networks with Adaptive Layer-Instance Normalization for Image-to-Image Translation
【作者】Junho Kim, Minjae Kim, Hyeonwoo Kang, Kwanghee Lee
【来源】 ICLR 2020
【文档链接】https://arxiv.org/abs/1907.10830
【代码链接】
- TensorFlow版本:https://github.com/taki0112/UGATIT
- Pytorch版本: https://github.com/znxlwm/UGATIT-pytorch
【论文复现营课程连接】https://aistudio.baidu.com/aistudio/education/group/info/1340
目录
目录
一 背景介绍
1.1 论文工作
论文针对两个不同域内映射图像的功能提出了一种新的无监督图像跨域转换方法,主要的创新点如下:
(1)通过在原始GAN中添加辅助分类器从而将Attention机制引入网络
(2)提出新的可学习的归一化方法AdaLIN,增强模型鲁棒性
1.2 相关前置论文
二 论文解析
2.1 模型结构
模型分为生成器和判别器两部分,结构几乎一致。其中生成器多出了Decoder模块,也就是论文引入的AdaLIN算法实现模块。以生成器为例,网络输入的图像通过通过Encoder编码阶段(下采样+残差模块)得到特征图,然后添加一个辅助分类引入Attention机制通过特征图的最大池化,经过全连接层输出一个节点的预测,然后将这个全连接层的参数和特征图相乘从而得到Attention的特征图。最后经过Decoder模块得到输出图像。
- 生成器
让 表示来自源域和目标域的样本。论文的生成器模型由编码器、解码器和辅助分类器组成,其中表示来自的概率。假设是编码器的第k个激活映射,