Conditional GAN

最新推荐文章于 2024-04-07 11:30:03 发布

keep--learning

最新推荐文章于 2024-04-07 11:30:03 发布

阅读量843

点赞数 5

分类专栏：李宏毅机器学习文章标签：生成对抗网络深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_51426525/article/details/134523362

版权

李宏毅机器学习专栏收录该内容

14 篇文章 0 订阅

订阅专栏

Text-to-Image

对于根据文字生成图像的问题，传统的做法就是训练一个NN，然后输入一段文字，输出对应一个图片，输出图片与目标图片越接近越好。存在的问题就是，比如火车对应的图片有很多张，如果用传统的NN来训练，模型会产生多张图像的平均，结果就会很模糊。

Conditional GAN

Conditional GAN与普通GAN的区别在于输入加入了一个额外的condition，并且在训练的时候使得输出的结果拟合这个 condition。

此时的discriminator的输入是generator的输出和conditional vector，此时discriminator有两个任务：

判断图片质量的好坏（图片是否是真实图片）。
图片是否和输入条件匹配。

Algorithm

训练D（固定G）:

首先从database中抽取m个样本，每个样本都是一对条件和图片。
从一个分布中抽取m个vector z；然后每个vector都加上条件，表示为（c，z）。
将（c，z）输入generator，生成m张图片x （条件+图片）。
从database中随机选取m个真实图片 x 。
计算损失，最大化损失。

训练G（固定D）:

随机产生m个噪声，随机从database中抽取m个条件；
通过generator得到G(C,Z)，然后经过discriminator得到D(G(C,Z))，更改G中的参数，使得它的得分越高越好。

具体设计条件GAN判别器，有两种方式：

图片x经过一个网络变成一个code，条件经过一个网络也变成一个code；把这两种code组合在一输入到网络里面，输出一个分数。
首先让图片经过一个网络，输出一个分数（用于判断图片是否真实），同时这个网络也输出一个code，这个code和条件结合起来输入到另外一个网络里，也输出一个分数（图片和文字是否匹配）。

Stack GAN（叠加生成对抗网络）

第一个网络生成小的图片，第二个网络生成大的图片。

Image-to-image

传统做法存在的问题就是产生的图片很模糊，是因为它是许多张图片的平均。

Conditional GAN的做法就是，generator的输入一张图片和noise z，输出一张图片，discriminator会输入产生的image和input，输出一个scalar。通过算法的迭代，生成下面第三张图片，看起来很清晰，但和真实的图片还是有差异。所以提出了GAN+close，对generator生成的image加上限制，使得生成的image与真实对象越接近越好，得到第四张图片。

Speech Enhancement(语音增强)

这里和image-to-image原理类似，都是把G的输入和输出作为D的输入。

Video Generation

 Video Generation能够根据影片的前几帧产生后几帧。conditional 为之前几帧的图片。

关注

5
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。