对抗神经网络CycleGAN论文解读

最新推荐文章于 2023-08-13 17:52:45 发布

纸上得来终觉浅～

最新推荐文章于 2023-08-13 17:52:45 发布

阅读量1.9k

点赞数 2

分类专栏： paper阅读图像处理文章标签： CycleGAN

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_32172681/article/details/99677467

版权

图像处理同时被 2 个专栏收录

56 篇文章 8 订阅

订阅专栏

21 篇文章 3 订阅

订阅专栏

论文题目：Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks

论文地址：https://arxiv.org/pdf/1703.10593.pdf

本文提出了一种在没有成对图像的情况下，学习将图像从源域x转换为目标域y的方法。它使用两个镜像对称的GAN，构成了一个环形网络，两个GAN共享两个生成器，并各自带一个判别器，即共有两个判别器和两个生成器，一个单向GAN两个loss，两个即共四个loss，叫做CycleGAN。给定两个图像集合，这个算法可以进行两个图像集合之间的翻译，如从斑马到马之间的互换、从冬天到夏天之间的互换。如图：

一、论文解读

1、前提

假设有两个图像分布和，我们的模型要训练2个映射：G : X → Y 和 F : Y → X。

引入了两个鉴别器和，用来判断图像来自于x还是来自于F(y)，用来判断图像来自于y还是来自于F(x)。

2、Adversarial Loss

将对抗损失应用到两个映射上，对于映射 G : X → Y 和它的鉴别器来说，它的损失函数可以表示为：

其中，G试图将G(x)生成的图像看起来更像Y中的真实图像，的目标是G(x)生成的图像和真实图像Y区分出来，G尝试最小化这个损失，而尝试最大化这个损失，也就是。映射F同理。

3、Cycle Consistency Loss

循环一致性损失表示为：

循环一致性是指，如果我们把句子从英语翻译成法语，然后再把它从法语翻译成英语，我们就应该回到原来的句子。

同时训练映射G和F，循环一致性损失会引起f(g(x)) ≈ x和g(f(y)) ≈ y。

，如图b，被称为正向一致性；，如图c，被称为反向一致性。

4、总损失函数

目标函数包含2个部分：区分生成图像分布和源图像分布的对抗性损失、防止所学习的映射g和f相互矛盾的循环一致性损失。

其中，是调节两种损失重要性的参数，我们的目标是：

这个模型可以看作将两个anto-encoder：F ◦ G : X → X 和 G ◦ F : Y → Y 连接起来。区别在于，我们的方法通过一个中间表示，将图像最后映射到自身。

5、网络结构

（1）整个网络是一个对偶结构，共有两个生成器网络：G和F，两个鉴别器网络：Dx和Dy。

（2）生成器结构（auto-encoder）：

这个网络包含2个strides为2的卷积层，几个残差块，2个strides为0.5的反卷积层

（3）鉴别器结构

使用70×70PatchGANs，目的是区分70×70重叠图像Patch是真是假。这种Patch level鉴别器架构比全图像鉴别器具有更少的参数，可以用全卷积处理任意大小的图像。

6、训练细节

使用了两个技术稳定模型训练的过程：

（1）用最小平方损失代替负对数似然目标。这种损失在训练期间更稳定，并产生更高质量的结果。对于GAN损失，G的训练目标是最小化，D的训练目标是最小化。

（2）为了减少震荡，使用G生成的旧样本训练鉴别器，保留一个图像缓冲区来存储之前创建的50个图像。

λ=10，使用批大小为1的Adam，所有网络都从零开始训练，学习率为0.0002。在前100个时期保持相同的学习率，在接下来的100个时期将学习率线性衰减为零。

纸上得来终觉浅～

关注

2
点赞
踩
22

收藏

觉得还不错? 一键收藏
0
评论
对抗神经网络CycleGAN论文解读

论文题目：Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks论文地址：https://arxiv.org/pdf/1703.10593.pdf本文提出了一种在没有成对图像的情况下，学习将图像从源域x转换为目标域y的方法。它使用两个镜像对称的GAN，构成了一个环形网络，两个GAN...
复制链接

扫一扫

专栏目录

纸上得来终觉浅～ CSDN认证博客专家 CSDN认证企业博客

码龄9年

151: 原创

16万+: 周排名

95万+: 总排名

89万+: 访问

: 等级

8644: 积分

213: 粉丝

580: 获赞

117: 评论

3255: 收藏

私信

关注

热门文章

分类专栏

语音识别 52篇
linux 3篇
工作
传统图像处理 13篇
数学 4篇
java 40篇
数据结构与算法 14篇
keras 2篇
ocr 2篇
图像处理 56篇
python 15篇
tensorflow 24篇
深度学习 79篇
机器学习 44篇
pandas 1篇
Kaggle 2篇
paper阅读 21篇
其他 39篇

最新评论

边缘检测：Canny算子
Midsummer-逐梦: 原图像
基于Kaldi+GStreamer搭建线上的实时语音识别器
m0_75126569: 和你一样
基于Kaldi+GStreamer搭建线上的实时语音识别器
m0_75126569: root@ubuntu:~/kaldi/kaldi-gstreamer-server/test/models# ./download-tedlium-nnet2.sh % Total % Received % Xferd Average Speed Time Time Time Current Dload Upload Total Spent Left Speed 0 0 0 0 0 0 0 0 --:--:-- 0:00:20 --:--:-- 0curl: (7) Failed to connect to phon.ioc.ee port 443: Connection refused gzip: stdin: unexpected end of file tar: Child returned status 1 tar: Error is not recoverable: exiting now
基于Kaldi+GStreamer搭建线上的实时语音识别器
小萌新Z: ot@zpq-virtual-machine:/home/zpq/桌面/kaldi-gstreamer-server/test/models# ./download-tedlium-nnet2.sh % Total % Received % Xferd Average Speed Time Time Time Current Dload Upload Total Spent Left Speed 0 0 0 0 0 0 0 0 --:--:-- 0:00:21 --:--:-- 0 curl: (7) Failed to connect to phon.ioc.ee port 8080 after 21352 ms: 连接被拒绝这是什么问题
语义分割算法Mask RCNN论文解读
惑许414: Traceback (most recent call last): File "D:/A_mask/mask R_CNN/Mask_RCNN-master/mrcnn/parallel_model.py", line 160, in <module> model = ParallelModel(model, GPU_COUNT) File "D:/A_mask/mask R_CNN/Mask_RCNN-master/mrcnn/parallel_model.py", line 38, in __init__ merged_outputs = self.make_parallel() File "D:/A_mask/mask R_CNN/Mask_RCNN-master/mrcnn/parallel_model.py", line 62, in make_parallel for name, x in zip(self.inner_model.input_names, AttributeError: 'Model' object has no attribute 'input_names' 怎么解决呢请问

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。