【论文笔记】CycleGAN

最新推荐文章于 2023-06-12 13:28:51 发布

迷川浩浩_ZJU

最新推荐文章于 2023-06-12 13:28:51 发布

阅读量5w

点赞数 23

分类专栏：深度学习论文笔记

本文链接：https://blog.csdn.net/qq_21190081/article/details/78807931

版权

深度学习同时被 2 个专栏收录

17 篇文章 13 订阅

订阅专栏

论文笔记

8 篇文章 2 订阅

订阅专栏

前言： CycleGAN是发表于ICCV17的一篇GAN工作，可以让两个domain的图片互相转化。传统的GAN是单向生成，而CycleGAN是互相生成，网络是个环形，所以命名为Cycle。并且CycleGAN一个非常实用的地方就是输入的两张图片可以是任意的两张图片，也就是unpaired。

单向GAN

读者可以按照原论文的顺序理解CycleGAN，这里我按照自己的思路解读。CycleGAN本质上是两个镜像对称的GAN，构成了一个环形网络。其实只要理解了一半的单向GAN就等于理解了整个CycleGAN。

上图是一个单向GAN的示意图。我们希望能够把domain A的图片（命名为a）转化为domain B的图片（命名为图片b）。为了实现这个过程，我们需要两个生成器 $G_{AB}$ 和 $G_{BA}$ ，分别把domain A和domain B的图片进行互相转换。图片A经过生成器 $G_{AB}$ 表示为Fake Image in domain B，用 $G_{AB}(a)$ 表示。而 $G_{AB}(a)$ 经过生辰器 $G_{BA}$ 表示为图片A的重建图片，用 $G_{BA}(G_{AB}(a))$ 表示。最后为了训练这个单向GAN需要两个loss，分别是生成器的重建loss和判别器的判别loss。

判别loss
判别器 $D_B$ 是用来判断输入的图片是否是真实的domain B图片，于是生成的假图片 $G_{AB}(A)$ 和原始的真图片 $B$ 都会输入到判别器里面，公示挺好理解的，就是一个0,1二分类的损失。最后的loss表示为：

$L G A N (G A B, D B, A, B) = E b \sim B [log D B (b)] + E a \sim A [log (1 - D B (G A B (a)))]$ $L_{GAN}(G_{AB},D_B,A,B)=\mathbb{E}_{b\sim B}[\log{D_B(b)}]+\mathbb{E}_{a\sim A}[\log{(1-D_B(G_{AB}(a)))}]$
生成loss
生成器用来重建图片a，目的是希望生成的图片 $G_{BA}(G_{AB}(a))$ 和原图a尽可能的相似，那么可以很简单的采取 $L_1$ loss或者 $L_2$ loss。最后生成loss就表示为：

$L (G A B, G B A, A, B) = E a \sim A [| | G B A (G A B (a)) - a | | 1]$ $L(G_{AB},G_{BA},A,B) = \mathbb{E}_{a \sim A}[||G_{BA}(G_{AB}(a))-a||_1]$

以上就是A→B单向GAN的原理。

CycleGAN

CycleGAN其实就是一个A→B单向GAN加上一个B→A单向GAN。两个GAN共享两个生成器，然后各自带一个判别器，所以加起来总共有两个判别器和两个生成器。一个单向GAN有两个loss，而CycleGAN加起来总共有四个loss。CycleGAN论文的原版原理图和公式如下，其实理解了单向GAN那么CycleGAN已经很好理解。

X→Y的判别器损失为，字母换了一下，和上面的单向GAN是一样的：

L G A N (G, D Y, X, Y) = E y \sim p d a t a (y) [log D Y (y)] + E x \sim p d a t a (x) [log (1 - D Y (G (x)))]

$L_{GAN}(G,D_Y,X,Y)=\mathbb{E}_{y\sim p_{data}(y)}[\log{D_Y(y)}]+\mathbb{E}_{x\sim p_{data}(x)}[\log{(1-D_Y(G(x)))}]$
同理Y→X的判别器损失为

L G A N (F, D X, Y, X) = E x \sim p d a t a (x) [log D X (x)] + E y \sim p d a t a (y) [log (1 - D X (F (y)))]

$L_{GAN}(F,D_X,Y,X)=\mathbb{E}_{x\sim p_{data}(x)}[\log{D_X(x)}]+\mathbb{E}_{y\sim p_{data}(y)}[\log{(1-D_X(F(y)))}]$
而两个生成器的loss加起来表示为：

L c y c (G, F) = E x \sim p d a t a (x) [| | F (G (x)) - x | | 1] + E y \sim p d a t a (y) [| | G (F (y)) - y | | 1]

$L_{cyc}(G,F) = \mathbb{E}_{x \sim p_{data}(x)}[||F(G(x))-x||_1]+\mathbb{E}_{y \sim p_{data}(y)}[||G(F(y))-y||_1]$
最终网络的所有损失加起来为：

L (G, F, D X, D Y) = L G A N (G, D Y, X, Y) + L G A N (F, D X, Y, X) + L c y c (G, F)

$L(G,F,D_X,D_Y)=L_{GAN}(G,D_Y,X,Y)+L_{GAN}(F,D_X,Y,X)+L_{cyc}(G,F)$

Note
论文里面提到判别器如果是对数损失训练不是很稳定，所以改成的均方误差损失，如下
$L L S G A N (G, D Y, X, Y) = E y \sim p d a t a (y) [(D Y (y) - 1) 2] + E x \sim p d a t a (x) [(1 - D Y (G (x))) 2]$ $L_{LSGAN}(G,D_Y,X,Y)=\mathbb{E}_{y\sim p_{data}(y)}[(D_Y(y)-1)^2]+\mathbb{E}_{x\sim p_{data}(x)}[(1-D_Y(G(x)))^2]$

下面放一张网友们自制的CycleGAN示意图，比论文原版的更加直观，出处见水印。

效果展示

CycleGAN的效果还是不错的，论文里给出了很多结果图，可以欣赏一下。

迷川浩浩_ZJU

关注

23
点赞
踩
177

收藏

觉得还不错? 一键收藏
18
评论
【论文笔记】CycleGAN

前言： CycleGAN是发表于ICCV17的一篇GAN工作，可以让两个domain的图片互相转化。传统的GAN是单向生成，而CycleGAN是互相生成，网络是个环形，所以命名为Cycle。并且CycleGAN一个非常实用的地方就是输入的两张图片可以是任意的两张图片，也就是unpaired。单向GAN读者可以按照原论文的顺序理解CycleGAN，这里我按照自己的思路解读。CycleGAN本质上是两个
复制链接

扫一扫