重参数化（Reparameterization）的原理

读思辨

于 2024-04-23 19:58:31 发布

阅读量1.4k

点赞数 17

分类专栏： Python 深度学习知识文章标签： python 人工智能

本文链接：https://blog.csdn.net/yangweipeng708/article/details/138136866

版权

Python 同时被 2 个专栏收录

37 篇文章 0 订阅

订阅专栏

深度学习知识

7 篇文章 0 订阅

订阅专栏

重参数化（Reparameterization）的原理

重参数化是变分自编码器（VAE）中用来解决可微分性问题的一种技术。在VAE中，我们的目标是最大化观测数据的边缘对数似然，这涉及到一个隐含变量 $z$ 的积分或求和。因为隐含变量是从某个分布中采样的，这直接导致了当我们尝试使用梯度下降方法优化VAE的参数时，由于采样操作的随机性，无法直接对其求导。

重参数化技巧通过将随机采样过程转换为确定性的操作来解决这一问题。具体来说，它将随机变量 $z$ 的采样过程分解为两步：

从一个固定的分布（通常是标准正态分布）中采样一个辅助噪声变量 $\epsilon$ 。
通过一个可微的变换将 $\epsilon$ 映射到隐变量 $z$ 。

这样，原本依赖于随机采样的模型输出现在变成了依赖于确定性函数的输出，使得整个模型关于其参数可微，从而可以通过标准的反向传播算法进行优化。

功能

允许反向传播：通过使用重参数化技巧，VAE的训练过程可以利用基于梯度的优化算法，如SGD或Adam，因为所有操作都是可微的。
改善训练稳定性：将随机性限制在输入端（噪声 $\epsilon$ ），而不是模型的中间，有助于提高模型训练的稳定性和收敛速度。
支持更复杂的概率模型：这种技巧使得模型可以学习复杂的数据分布，同时保持模型的可训练性。

Python 示例

下面是使用PyTorch实现的VAE中应用重参数化技巧的简单示例：

import torch
from torch import nn
import torch.nn.functional as F

class VAE(nn.Module):
    def __init__(self):
        super(VAE, self).__init__()
        self.fc1 = nn.Linear(784, 400)  # 输入特征到隐层
        self.fc21 = nn.Linear(400, 20)  # 隐层到均值
        self.fc22 = nn.Linear(400, 20)  # 隐层到log方差
        self.fc3 = nn.Linear(20, 400)   # 隐层到输出
        self.fc4 = nn.Linear(400, 784)  # 输出层

    def encode(self, x):
        h1 = F.relu(self.fc1(x))
        return self.fc21(h1), self.fc22(h1)

    def reparameterize(self, mu, logvar):
        std = torch.exp(0.5*logvar)
        eps = torch.randn_like(std)
        return mu + eps*std

    def decode(self, z):
        h3 = F.relu(self.fc3(z))
        return torch.sigmoid(self.fc4(h3))

    def forward(self, x):
        mu, logvar = self.encode(x.view(-1, 784))
        z = self.reparameterize(mu, logvar)
        return self.decode(z), mu, logvar

# 损失函数和训练代码在这里省略，只关注模型结构和重参数化部分。

在这个示例中，reparameterize 函数接收从编码器生成的均值和对数方差，然后生成一个随机样本 z，该样本符合由均值 mu 和方差 exp(logvar) 定义的正态分布。这个过程使得模型在训练过程中能够通过梯度下

降法进行优化。

其他参考：

漫谈重参数：从正态分布到Gumbel Softmax。
Categorical Reparameterization with Gumbel-Softmax

读思辨

关注

17
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
重参数化（Reparameterization）的原理

因为隐含变量是从某个分布中采样的，这直接导致了当我们尝试使用梯度下降方法优化VAE的参数时，由于采样操作的随机性，无法直接对其求导。在VAE中，我们的目标是最大化观测数据的边缘对数似然，这涉及到一个隐含变量。这样，原本依赖于随机采样的模型输出现在变成了依赖于确定性函数的输出，使得整个模型关于其参数可微，从而可以通过标准的反向传播算法进行优化。重参数化技巧通过将随机采样过程转换为确定性的操作来解决这一问题。具体来说，它将随机变量。函数接收从编码器生成的均值和对数方差，然后生成一个随机样本。
复制链接

扫一扫