自编码器-变分自编码器-python案例

最新推荐文章于 2024-05-20 22:29:07 发布

高山莫衣

最新推荐文章于 2024-05-20 22:29:07 发布

阅读量999

点赞数 2

分类专栏： python_算法学习文章标签： python 深度学习机器学习

原创作品，共同进步！

本文链接：https://blog.csdn.net/AdamCY888/article/details/129851237

版权

python_算法学习专栏收录该内容

26 篇文章 3 订阅

订阅专栏

自编码器和变分自编码器是无监督学习的神经网络模型，常用于数据压缩和重建。自编码器由编码器和解码器组成，实现数据的降维和重构；变分自编码器引入概率模型，能生成新样本。文中提供了MNIST数据集上的Python实现示例，展示了两种模型的训练和应用。

摘要由CSDN通过智能技术生成

自编码器-案例

自编码器是一种无监督学习的神经网络模型，用于将数据进行压缩和重建。它由一个编码器和一个解码器组成，其中编码器将原始数据映射到低维空间中的编码表示，而解码器则将编码表示映射回原始数据空间。自编码器可以用于降维、去噪声、图像压缩等任务。

下面是一个简单的Python例子，使用自编码器对MNIST手写数字数据集进行压缩和重建：

import numpy as np
from keras.datasets import mnist
from keras.models import Model
from keras.layers import Input, Dense

# 加载数据集
(x_train, _), (x_test, _) = mnist.load_data()

# 数据预处理
x_train = x_train.astype('float32') / 255.
x_test = x_test.astype('float32') / 255.
x_train = np.reshape(x_train, (len(x_train), np.prod(x_train.shape[1:])))
x_test = np.reshape(x_test, (len(x_test), np.prod(x_test.shape[1:])))

# 定义编码器
input_img = Input(shape=(784,))
encoded = Dense(32, activation='relu')(input_img)

# 定义解码器
decoded = Dense(784, activation='sigmoid')(encoded)

# 定义整个自编码器模型
autoencoder = Model(input_img, decoded)

# 编译自编码器模型
autoencoder.compile(optimizer='adam', loss='binary_crossentropy')

# 训练自编码器模型
autoencoder.fit(x_train, x_train,
                epochs=50,
                batch_size=256,
                shuffle=True,
                validation_data=(x_test, x_test))

# 对测试集进行重建
decoded_imgs = autoencoder.predict(x_test)

# 显示重建结果
import matplotlib.pyplot as plt

n = 10
plt.figure(figsize=(20, 4))
for i in range(n):
    # 原始图像
    ax = plt.subplot(2, n, i + 1)
    plt.imshow(x_test[i].reshape(28, 28))
    plt.gray()
    ax.get_xaxis().set_visible(False)
    ax.get_yaxis().set_visible(False)
    
    # 重建图像
    ax = plt.subplot(2, n, i + 1 + n)
    plt.imshow(decoded_imgs[i].reshape(28, 28))
    plt.gray()
    ax.get_xaxis().set_visible(False)
    ax.get_yaxis().set_visible(False)
    
plt.show()

变分自编码器-案例

变分自编码器是一种基于概率的自编码器，它使用潜在空间中的高斯分布来实现更加精细的压缩和解压缩。与普通的自编码器不同，它不仅学习如何对数据进行编码和解码，还会学习如何生成新的样本。

下面是一个简单的Python例子，使用变分自编码器对MNIST手写数字数据集进行压缩和重建：

import numpy as np
from keras.datasets import mnist
from keras.models import Model
from keras.layers import Input, Dense, Lambda
from keras.losses import binary_crossentropy
from keras.utils import plot_model

# 加载数据集
(x_train, _), (x_test, _) = mnist.load_data()

# 数据预处理
x_train = x_train.astype('float32') / 255.
x_test = x_test.astype('float32') / 255.
x_train = np.reshape(x_train, (len(x_train), np.prod(x_train.shape[1:])))
x_test = np.reshape(x_test, (len(x_test), np.prod(x_test.shape[1:])))

# 定义编码器
input_img = Input(shape=(784,))
hidden = Dense(256, activation='relu')(input_img)

# 计算潜在变量的均值和方差
z_mean = Dense(2)(hidden)
z_log_var = Dense(2)(hidden)

# 采样函数
def sampling(args):
    z_mean, z_log_var = args
    epsilon = K.random_normal(shape=K.shape(z_mean))
    return z_mean + K.exp(0.5 * z_logvar) * epsilon

定义潜在空间采样层

z = Lambda(sampling)([z_mean, z_log_var])

定义解码器

decoder_hidden = Dense(256, activation='relu') decoder_out = Dense(784, activation='sigmoid')

解码器的输入是采样后的潜在变量

decoded_hidden = decoder_hidden(z) decoded_out = decoder_out(decoded_hidden)

定义整个变分自编码器模型

vae = Model(input_img, decoded_out)

定义VAE的损失函数

def vae_loss(x, decoded): xent_loss = binary_crossentropy(x, decoded) kl_loss = -0.5 * K.sum(1 + z_log_var - K.square(z_mean) - K.exp(z_log_var), axis=-1) return xent_loss + kl_loss

编译VAE模型

vae.compile(optimizer='adam', loss=vae_loss)

训练VAE模型

vae.fit(x_train, x_train, epochs=50, batch_size=128, shuffle=True, validation_data=(x_test, x_test))

对测试集进行重建和生成新的样本

decoded_imgs = vae.predict(x_test) n = 10 plt.figure(figsize=(20, 4)) for i in range(n): # 原始图像 ax = plt.subplot(3, n, i + 1) plt.imshow(x_test[i].reshape(28, 28)) plt.gray() ax.get_xaxis().set_visible(False) ax.get_yaxis().set_visible(False)

# 重建图像
ax = plt.subplot(3, n, i + 1 + n)
plt.imshow(decoded_imgs[i].reshape(28, 28))
plt.gray()
ax.get_xaxis().set_visible(False)
ax.get_yaxis().set_visible(False)

# 生成的图像
z_sample = np.array([[np.random.normal(), np.random.normal()]])
generated_img = decoder_out(decoder_hidden(z_sample)).numpy()
ax = plt.subplot(3, n, i + 1 + 2*n)
plt.imshow(generated_img.reshape(28, 28))
plt.gray()
ax.get_xaxis().set_visible(False)
ax.get_yaxis().set_visible(False)
plt.show()