Keras-11 GAN MNIST

最新推荐文章于 2021-03-18 13:32:43 发布

芥末的无奈

最新推荐文章于 2021-03-18 13:32:43 发布

阅读量4.6k

点赞数 2

分类专栏：深度学习 keras tensorflow 文章标签： keras gan tensorflow

本文链接：https://blog.csdn.net/weiwei9363/article/details/79870289

版权

keras 同时被 3 个专栏收录

15 篇文章 2 订阅

订阅专栏

深度学习

14 篇文章 2 订阅

订阅专栏

tensorflow

8 篇文章 0 订阅

订阅专栏

GAN(Generative Adversarial Network) 生成对抗网络

GAN由Ian J. Goodfellow在2015年提出，被认为是深度学习领域中最重要的发明之一，今天我们将实现一个最简单的GAN用来生成MNIST手写字符图片
参考的材料有
+ GAN论文
+ gan_mnist
完整代码在 https://github.com/jiemojiemo/Keras-Demo/tree/master/GAN

GAN简单介绍

GAN

GAN的由两部分组成：
+ 生成器(Generator)，用来生成假(fake)的数据，在生成MNIST任务中，输入为任意噪声（通常为高斯噪声），输出为一张图片

Gaussuan noise --> Generator --> fake image
+ 判别器(Discriminator),用来判断数据是否为真(real)，在MNIST任务中，输入为一张图片，输出是为真的概率在[0,1]之间
fake/real image --> Discriminator --> probability of real

这里有些例子，大概可以直观的解释一下GAN的工作原理

造假者和警察：造假者造出假钞，他们的目的是以假乱真，也就是使得假钞越来越像真钞；警察的目的是判断一张钞票是真的还是假的，尽可能使将一张真钞判断为真，避免判断的失误。

魔术师和观众：魔术师能够变出一只假兔子，他需要确保这只兔子足够真实使得观众无法察觉出这是一只假兔子；而台下的观众总是希望能够找到魔术师的破绽，尽可能地判断魔术师变出来兔子的真假。

以上，造假者和魔术师就是生成器，警察和观众就是判别器

我们站在数学的角度来理解下GAN，论文中将GAN描述为一个”two-player minimax game”

min G max D V (D, G) = E x \sim p d a t a (x) [log D (x)] + E z \sim p z (z) [log (1 - D (G (z)))]

$\min_G \max_D V(D,G) = \Bbb E_{x \sim p_{data}(x)}[\log D(x)] + \Bbb E_{z \sim p_{z}(z)}[\log(1 - D(G(z)))]$

这个部分我们分开两个部分看，首先是判别器，判别器D希望V的值最大

max D V (D, G) = E x \sim p d a t a (x) [log D (x)] + E z \sim p z (z) [log (1 - D (G (z)))]

$\max_D V(D,G) = \Bbb E_{x \sim p_{data}(x)}[\log D(x)] + \Bbb E_{z \sim p_{z}(z)}[\log(1 - D(G(z)))]$
其中
1.

D(x)∈[0,1] D ( x ) ∈ [ 0 , 1 ] $D(x) \in [0,1]$ ,

log(D(x))∈[−∞,0] log ⁡ ( D ( x ) ) ∈ [ − ∞ , 0 ] $\log(D(x)) \in [-\infty ,0]$ ,

Ex∼pdata(x)[logD(x)]∈[−∞,0] E x ∼ p d a t a ( x ) [ log ⁡ D ( x ) ] ∈ [ − ∞ , 0 ] $\Bbb E_{x \sim p_{data}(x)}[\log D(x)] \in [-\infty, 0]$
2.

1−D(G(z))∈[0,1] 1 − D ( G ( z ) ) ∈ [ 0 , 1 ] $1-D(G(z)) \in [0,1]$ ,

log(1−D(G(z)))∈[−∞,0] log ⁡ ( 1 − D ( G ( z ) ) ) ∈ [ − ∞ , 0 ] $\log(1-D(G(z))) \in [-\infty, 0]$ ,

Ez∼pz(z)[log(1−D(G(z)))∈[−∞,0] E z ∼ p z ( z ) [ log ⁡ ( 1 − D ( G ( z ) ) ) ∈ [ − ∞ , 0 ] $\Bbb E_{z \sim p_{z}(z)}[\log(1 - D(G(z))) \in [-\infty, 0]$

那么 $V(D,G) \in [-\infty, 0]$

当 $D(x)=1, D(G(z))=0$ 时 V的最大值为0，从这可以看出，GAN要求判别器能够”明辨是非”：

当 $x \sim p_{data}$ 时（当 x 是real时），判别器要判断为真的概率越靠近1越好
当 $x \sim p_{z}$ 时（当 x 是 fake时），判别器要判断为真的概率越靠近0越好

然后我们看生成器，生成器G希望V的值最小(注意，只有后面那一项出现了G，所以下面的公式只有后面那一项)

min G V (D, G) = E z \sim p z (z) [log (1 - D (G (z)))]

$\min_G V(D,G)= \Bbb E_{z \sim p_{z}(z)}[\log(1 - D(G(z)))]$
其中
1.

1−D(G(z))∈[0,1] 1 − D ( G ( z ) ) ∈ [ 0 , 1 ] $1-D(G(z)) \in [0,1]$ ,

log(1−D(G(z)))∈[−∞,0] log ⁡ ( 1 − D ( G ( z ) ) ) ∈ [ − ∞ , 0 ] $\log(1-D(G(z))) \in [-\infty, 0]$ ,

Ez∼pz(z)[log(1−D(G(z)))∈[−∞,0] E z ∼ p z ( z ) [ log ⁡ ( 1 − D ( G ( z ) ) ) ∈ [ − ∞ , 0 ] $\Bbb E_{z \sim p_{z}(z)}[\log(1 - D(G(z))) \in [-\infty, 0]$

那么 $V(D, G) \in [-\infty, 0]$

当 $D(G(z))=1$ 时，V的最小值为 $-\infty$ ，从这可以看出，GAN要求生成器欺骗判别器：

当 $x \sim p_{z}$ 时（当 x 是fake）时，生成器要将x进行变化，使得让判别器判断x为真的概率越靠近1越好

GAN MNIST

废话讲太多了，我们上代码，以下代码参考了 gan_mnist

原来的代码用的是Tensorflow，在这里我们将结合keras，因为keras封装好的各种层真的好方便啊

这里使用MNIST数据集，我们将MNIST的数据拉成一维

import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
import pickle as pkl

%matplotlib inline
%config InlineBackend.figure_format = 'retina'

# 导入数据
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets('MNIST_data')

# 模型输入
# 输入有两个：真实图像输入 和 高斯噪声输入
def model_input(real_dim, z_dim):
    '''

    Args:
        real_dim, 真实图像的大小，例如MNIST中为 28*28 = 784
        z_dim, 高斯噪声的大小

    Returns:
        两个输入的张量
    '''

    inputs_real = tf.placeholder(tf.float32, [None, real_dim], name='input_real')
    inputs_z = tf.placeholder(tf.float32, [None, z_dim], name='input_z')

    return inputs_real, inputs_z

网络模型

Generator_network

def generator(z, out_dim, n_units=128, reuse=False, alpha=0.01):
    '''
    生成网络
    Args:
        z, 高斯噪声输入
        out_dim, 输出的大小，例如在MNIS中为MNIST
        n_units, 中间隐藏层的单元个数
        reuse, 是否重复使用
        alpha, LeakyReLU的参数

    Returns:
        生成的数据
    '''
    with tf.variable_scope('generator', reuse=reuse):
        h1 = tf.keras.layers.Dense(n_units)(z)
        h1 = tf.keras.layers.LeakyReLU(alpha)(h1)

        out = tf.keras.layers.Dense(out_dim, activation='tanh')(h1)

    return out

def discriminator(x, n_units=128, reuse=False, alpha=0.01):
    '''
    判别网络
    Args:
        x, 输入的图像
        n_units, 中间隐藏层的单元个数
        reuse, 是否重复使用
        alpha, LeakyReLU的参数

    Returns:
        为真的概率
    '''

    with tf.variable_scope('discriminator', reuse=reuse):
        h1 = tf.keras.layers.Dense(n_units)(x)
        h1 = tf.keras.layers.LeakyReLU(alpha)(h1)

        logits = tf.keras.layers.Dense(1)(h1)
        out = tf.keras.layers.Activation('softmax')(logits)
    return out, logits

# 超参数

# 28*28 for mnist
input_size = 784
# 高斯噪声输入大小
z_size = 100
# 隐层神经元个数
g_hidden_size = 128
d_hidden_size = 128
# Leak factor
alpha = 0.01
# Smoothing，用于平滑label(后面有解释)
smooth = 0.1

建立网络

tf.reset_default_graph()
# 建立输入
input_real, input_z = model_input(input_size, z_size)

# 生成器
g_model = generator(input_z, input_size, g_hidden_size, alpha=alpha)

# 判别器
d_model_real, d_logits_real = discriminator(input_real, d_hidden_size, alpha=alpha)
d_model_fake, d_logits_fake = discriminator(g_model, reuse=True, n_units=d_hidden_size, alpha=alpha)

判别器和生成器的Losses

判别器的loss为 d_loss = d_loss_real + d_loss_fake, d_loss_real和d_loss_fake用的是二元交叉熵

对于真实图像，给定的label全为1，但是作者认为1这个目标有点难，为了让网络更容易训练，把1降低为0.9
对于假图像，给定的label全为0

生成器的loss为 g_loss，生成器希望欺骗判别器，因此给定的label全为1

# Calculate losses

d_loss_real = tf.reduce_mean(
                  tf.nn.sigmoid_cross_entropy_with_logits(logits=d_logits_real, 
                                                          labels=tf.ones_like(d_logits_real) * (1 - smooth)))
d_loss_fake = tf.reduce_mean(
                  tf.nn.sigmoid_cross_entropy_with_logits(logits=d_logits_fake, 
                                                          labels=tf.zeros_like(d_logits_real)))
d_loss = d_loss_real + d_loss_fake

g_loss = tf.reduce_mean(
             tf.nn.sigmoid_cross_entropy_with_logits(logits=d_logits_fake,
                                                     labels=tf.ones_like(d_logits_fake)))

优化器

生成器和判别器是独立的，因此在训练时我们用两个优化器分别对其训练

learning_rate = 0.002

# 获取相应要训练的变量
g_vars = tf.get_collection(tf.GraphKeys.TRAINABLE_VARIABLES, 'generator')
d_vars = tf.get_collection(tf.GraphKeys.TRAINABLE_VARIABLES, 'discriminator')

d_train_opt = tf.train.AdamOptimizer(learning_rate).minimize(d_loss, var_list=d_vars)
g_train_opt = tf.train.AdamOptimizer(learning_rate).minimize(g_loss, var_list=g_vars)

进行训练

batch_size = 100
epochs = 100
samples = []
losses = []

# 只保存生成器变量
saver = tf.train.Saver(var_list = g_vars)

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())

    for e in range(epochs):
        for ii in range(mnist.train.num_examples // batch_size):

            # 获取一个batch的数据
            batch = mnist.train.next_batch(batch_size)
            # 将图片拉伸至一维
            batch_images = batch[0].reshape((batch_size, 28*28))
            # 预处理数据
            batch_images = batch_images*2 - 1

            # 高斯噪声输入
            batch_z = np.random.uniform(-1, 1, size=(batch_size, z_size))

            # run optimizers
            _ = sess.run(d_train_opt, feed_dict={input_real:batch_images, input_z:batch_z})
            _ = sess.run(g_train_opt, feed_dict={input_z:batch_z})

        train_loss_d = sess.run(d_loss, {input_z:batch_z, input_real:batch_images})
        train_loss_g = g_loss.eval({input_z:batch_z})

        print("Epoch {}/{}...".format(e+1, epochs),
              "Discriminator Loss: {:.4f}...".format(train_loss_d),
              "Generator Loss: {:.4f}".format(train_loss_g))

        # Save losses to view after training
        losses.append((train_loss_d, train_loss_g))

        # Sample from generator as we're training for viewing afterwards
        sample_z = np.random.uniform(-1, 1, size=(16, z_size))
        gen_samples = sess.run(
                       generator(input_z, input_size, reuse=True),
                       feed_dict={input_z: sample_z})

        samples.append(gen_samples)
        saver.save(sess, './checkpoints/generator.ckpt')

# Save training generator samples
with open('train_samples.pkl', 'wb') as f:
    pkl.dump(samples, f)

Epoch 1/100... Discriminator Loss: 0.3538... Generator Loss: 4.1175
......
Epoch 92/100... Discriminator Loss: 1.1043... Generator Loss: 1.4442

Training Loss

fig, ax = plt.subplots()
losses = np.array(losses)
plt.plot(losses.T[0], label='Discriminator')
plt.plot(losses.T[1], label='Generator')
plt.title("Training Losses")
plt.legend()

loss

训练的结果

def view_samples(epoch, samples):
    fig, axes = plt.subplots(figsize=(7,7), nrows=4, ncols=4, sharey=True, sharex=True)
    for ax, img in zip(axes.flatten(), samples[epoch]):
        ax.xaxis.set_visible(False)
        ax.yaxis.set_visible(False)
        im = ax.imshow(img.reshape((28,28)), cmap='Greys_r')

    return fig, axes

# Load samples from generator taken while training
with open('train_samples.pkl', 'rb') as f:
    samples = pkl.load(f)

_ = view_samples(-1, samples)

这里写图片描述

rows, cols = 10, 6
fig, axes = plt.subplots(figsize=(7,12), nrows=rows, ncols=cols, sharex=True, sharey=True)

for sample, ax_row in zip(samples[::int(len(samples)/rows)], axes):
    for img, ax in zip(sample[::int(len(sample)/cols)], ax_row):
        ax.imshow(img.reshape((28,28)), cmap='Greys_r')
        ax.xaxis.set_visible(False)
        ax.yaxis.set_visible(False)

这里写图片描述

Sampling from the generator

saver = tf.train.Saver(var_list=g_vars)
with tf.Session() as sess:
    saver.restore(sess, tf.train.latest_checkpoint('checkpoints'))
    sample_z = np.random.uniform(-1, 1, size=(16, z_size))
    gen_samples = sess.run(
                   generator(input_z, input_size, reuse=True),
                   feed_dict={input_z: sample_z})
_ = view_samples(0, [gen_samples])

这里写图片描述

芥末的无奈

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
3
评论
Keras-11 GAN MNIST

GAN(Generative Adversarial Network) 生成对抗网络GAN由Ian J. Goodfellow在2015年提出，被认为是深度学习领域中最重要的发明之一，今天我们将实现一个最简单的GAN用来生成MNIST手写字符图片参考的材料有 + GAN论文 + gan_mnist 完整代码在 https://github.com/jiemojiemo/Keras-D...
复制链接

扫一扫