GAN 生成对抗网络 10-8 Intelligent Photo Editing

在这里插入图片描述
在这里插入图片描述
现在的问题是,输入一个向量会生成一张图片,但是我们不知道向量长什么样子。我们可以使用GAN+AutoEncoder来解决这个问题。即在向量前面加一个Encoder,由于Encoder和Discriminator很像,所以可以使用Discriminator来初始化Encoder。注意Generator(Decoder)是训练好的,固定不动。
做完这件事情之后,我们可以把database中的图片拿出来,放到Encoder中,可以得到vector。

在这里插入图片描述
比如我们要将短发生成长发,我们可以这样做:
先把长发的图片丢进Encoder,可以得到一堆vector,再把短发的图片丢进Encoder得到另一堆Vector,二者分别取平均并作差,可以得到Zlong。
我们取出一张短发的图片,输入Encoder,加上Zlong得到z’,将z‘丢进Generator即可得到长头发的图片。

在这里插入图片描述
商品生成的智能photoshop实现原理:
如上图,先训练一个GAN,使得输入一张图片可以在latent space中找到对应的位置。然后输入一张图片,在该图片邻域内寻找,使得找到的图片为原来的商品且满足用户提出的要求。

第一个问题:如何通过图片找到z呢?
在这里插入图片描述
有如上三种方法:1.我们可以找到Generator,把z喂进去,生成一张图片,计算生成图片和原始图片某种距离最小值得到的z。可以使用梯度下降法来进行优化。对于G(z)和x的距离问题由好多种方法,可以使用pixel-wise方法,也可以使用neural network生成两个向量,计算两个向量的距离。
2.使用AutoEncoder。
3.由于第一种方法梯度下降容易陷入局部极小值,因此可以使用方法2得到的结果z来初始化方法1的z。

在这里插入图片描述
然后定义目标函数,U代表满足用户提出的某种限制,第二项表示生成的图片与原始图片足够接近,第三项代表生成图片为真实图片。

在这里插入图片描述
还可以用GAN做超分辨率。

在这里插入图片描述
也可以用GAN做补全。用conditional GAN来做,输入为缺少的图,输出为完全的图。

但实际上,图片补全是很难做的。
在这里插入图片描述
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值