Image-to-Image Translation with Conditional Adversarial Networks笔记

原创于 2017-09-22 23:44:09 发布

· 1.2k 阅读

·

0

·

版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

算法专栏收录该内容

22 篇文章

订阅专栏

论文地址：https://phillipi.github.io/pix2pix/ 这个地址里面有源码

论文主要工作

1.目标函数中加入L1约束

加入了L1约束项，该约束项主要是为了让生成的图像与ground truth尽可能靠近（从像素层面）。为什么不是加的L2约束项呐？文中说：“using L1 distance rather than L2 as L1 encourages less blurring”。加入之后的目标函数变为：
这里写图片描述

2.在生成器中，用U-net结构代替encoder-decoder

U-net与encoder-decoder相比主要是多了skip connection. 使得网络的表达能力更强。

3.使用PatchGAN作为Discriminator

通常判断都是对生成样本整体进行判断，比如对一张图片来说，就是直接看整张照片是否真实。而且Image-to-Image Translation中很多评价是像素对像素的，所以在这里提出了分块判断的算法，在图像的每个 $N\times N$ 块上去判断是否为真，最终平均给出结果。
ps:在开源的tensorflow版本的源代码中没看到PatchGAN。

实验评估方式

1. Amazon Mechanical Turk(AMT)方式

简单说就是让人对生成的图像给出主观评价

2. FCN-score

FCN是经典的语义分割网络，

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。