GAN 生成对抗网络 10-8 Intelligent Photo Editing

最新推荐文章于 2024-10-04 11:19:03 发布

Even丶666

最新推荐文章于 2024-10-04 11:19:03 发布

阅读量98

点赞数

分类专栏：深度学习文章标签：自然语言处理深度学习神经网络

本文链接：https://blog.csdn.net/m0_45868903/article/details/120159395

版权

深度学习专栏收录该内容

13 篇文章 0 订阅

订阅专栏

在这里插入图片描述

现在的问题是，输入一个向量会生成一张图片，但是我们不知道向量长什么样子。我们可以使用GAN+AutoEncoder来解决这个问题。即在向量前面加一个Encoder，由于Encoder和Discriminator很像，所以可以使用Discriminator来初始化Encoder。注意Generator（Decoder）是训练好的，固定不动。
做完这件事情之后，我们可以把database中的图片拿出来，放到Encoder中，可以得到vector。

在这里插入图片描述
比如我们要将短发生成长发，我们可以这样做：
先把长发的图片丢进Encoder，可以得到一堆vector，再把短发的图片丢进Encoder得到另一堆Vector，二者分别取平均并作差，可以得到Zlong。
我们取出一张短发的图片，输入Encoder，加上Zlong得到z’，将z‘丢进Generator即可得到长头发的图片。

在这里插入图片描述
商品生成的智能photoshop实现原理：
如上图，先训练一个GAN，使得输入一张图片可以在latent space中找到对应的位置。然后输入一张图片，在该图片邻域内寻找，使得找到的图片为原来的商品且满足用户提出的要求。

第一个问题：如何通过图片找到z呢？
在这里插入图片描述
有如上三种方法：1.我们可以找到Generator，把z喂进去，生成一张图片，计算生成图片和原始图片某种距离最小值得到的z。可以使用梯度下降法来进行优化。对于G（z）和x的距离问题由好多种方法，可以使用pixel-wise方法，也可以使用neural network生成两个向量，计算两个向量的距离。
2.使用AutoEncoder。
3.由于第一种方法梯度下降容易陷入局部极小值，因此可以使用方法2得到的结果z来初始化方法1的z。