机器学习专栏（72）：从降维到造物——自动编码器与生成对抗网络的AI艺术-CSDN博客

组件	功能描述	类比解释
编码器	将输入压缩为潜在表征	数据压缩软件
潜在空间	存储数据关键特征的密集表示	ZIP压缩文件
解码器	从潜在表征重建原始数据	解压程序
重构损失	衡量重建数据与原始数据的差异	压缩解压后的文件完整性

1.3 实现一个基础自动编码器

from tensorflow import keras

# 编码器构建
encoder = keras.models.Sequential([
    keras.layers.Dense(2, input_shape=[3])  # 3D输入压缩到2D
])

# 解码器构建
decoder = keras.models.Sequential([
    keras.layers.Dense(3, input_shape=[2])  # 2D重建为3D
])

# 完整自动编码器
autoencoder = keras.models.Sequential([encoder, decoder])

# 编译配置
autoencoder.compile(loss="mse", optimizer="adam")

# 训练过程
history = autoencoder.fit(X_train, X_train, epochs=200, verbose=0)

代码解析：

输入输出维度相同（3D->2D->3D）
使用MSE损失函数确保精确重建
无激活函数的线性层实现类似PCA的效果
自监督学习模式（输入即目标）

1.4 超越PCA的高级特性

当引入非线性激活函数时，自动编码器展现出更强大的特征提取能力：

# 深度自动编码器示例
deep_autoencoder = keras.models.Sequential([
    keras.layers.Dense(128, activation='relu', input_shape=[784]),
    keras.layers.Dense(64, activation='relu'),
    keras.layers.Dense(32, activation='relu'),  # 编码层
    keras.layers.Dense(64, activation='relu'),
    keras.layers.Dense(128, activation='relu'),
    keras.layers.Dense(784, activation='sigmoid')  # 输出与输入同维度
])

性能对比表：

方法	MNIST重建误差	训练时间	特征可解释性
PCA	0.032	2s	高
线性AE	0.028	30s	中
深度非线性AE	0.015	5min	低

二、自动编码器的七十二变

2.1 降噪自动编码器

实现关键：

# 添加噪声的预处理
def add_noise(images, noise_factor=0.5):
    noisy = images + noise_factor * np.random.normal(loc=0.0, scale=1.0, size=images.shape)
    return n