对抗生成网络（Generative Adversarial Network）

最新推荐文章于 2024-09-07 18:59:08 发布

蓝色枫魂

最新推荐文章于 2024-09-07 18:59:08 发布

阅读量1.7k

点赞数

分类专栏： Deep Learning

本文链接：https://blog.csdn.net/qq_32690999/article/details/78856673

版权

本文是关于李宏毅教授的《Generative Adversarial Network (GAN)》课程的学习笔记，探讨了GAN的基本思想、应用场景以及结构化学习。GAN通过生成器与判别器的对抗学习，实现图像、序列等复杂对象的生成。在结构化学习中，GAN能用于机器翻译、语音识别等领域。此外，介绍了条件生成（Conditional Generation）在根据指令生成特定内容的图像方面的应用。

摘要由CSDN通过智能技术生成

本课程是针对李宏毅教授在Youtube上上传的机器学习课程视频《Introduction of Generative Adversarial Network (GAN)》的学习笔记。

课程视频地址

Introduction
Outline
Basic Idea of GAN
When do we need GAN
GAN as structured learning algorithm
Conditional Generation by GAN

Introduction

某人在Quara上的问题：非监督学习领域最近有没有什么突破性的进展呢？

Lecun大神亲自回答：对抗训练可能是有史以来（since sliced bread，有一个好东西出现的意思）最酷的东西。

又有人问：最近在深度学习领域最近有没有什么突破性的进展呢？

Lecun大神答：Generative Adversarial Network (also called GAN), it’s the most interesting idea in the last 10 years in ML in my opinion。

How to pronounce “GAN” (2333)

Outline

Basic Idea of GAN

我们通常用GAN来生成某些东西，即需要一个生成器（Generator），他可以是一个神经网络（NN），或者任意一个函数。

那生成器怎么生成东西呢？我们会喂给生成器一个向量，这样它就会给定一个我们想要的输出。至于输出什么就取决于我们需要什么。比如我们需要输出图片，那么实际上生成器就应该输出一个能表示图片的矩阵。也可以让生成器输出一句话/sequence。

如下图：我们用二次元人脸生成作为例子。

输入给生成器的向量的不同维度代表了输出结果的某些特征。比如假设第一个维度代表了人物头发的长度，那么其值越大，生成的人物的头发就越长。或者假设倒数第二维决定头发是不是蓝色；或者假设最后一个维度代表嘴巴是张开的还是闭着的。

GAN的突出部分在于：它还引入了另一个角色–判别器（Discriminator）。

判别器本身也是一个NN。当将一个图片输入判别器，它会输出一个标量（scalar），表示该图片有多大可能性是人画出来的，值越大表示它认为这张图片越可能是人画的，反之则认为是机器生成的。

能不能比较准确地判别取决于判别器学得好不好。

那为什么我们会需要判别器呢？

Ian Goodfellow（GAN的作者）给了一个很符合直觉的比喻：

印假钞的犯罪者会尽量制作和真钞尽可能想象的钞票（生成器），而警察会尽力去判别哪些钞票是真的，哪些是假的（判别器），而针对警察鉴别能力的提升，犯罪者也会不断针对性地提高印假钞的技术，使得警察无法鉴别真钞和假钞，即骗过警察。

这里，李老师也举了一个例子：

枯叶蝶可以很好地伪装成一个枯萎的树叶的样子，但它的祖先其实并不是这样，而是和普通的蝴蝶一样颜色五彩缤纷，还很鲜艳。但是枯叶蝶一直有一个天敌鸟，天敌鸟会认为彩色的明显是蝴蝶，不会是枯叶的那种棕色的。于是由于物竞天择，枯叶蝶进化了一代，变成了棕色，但是不久后，天敌鸟也学到了，它进一步了解到，蝴蝶是不会有叶脉的的。于是又由于物竞天择，枯叶蝶生成了叶脉纹路，进化成了今天的样子。而，天敌鸟也跟着进化…两者的进化不断交替，不断升级…