Reparameterization trick（重参数化技巧）

重剑DS

已于 2023-10-22 19:40:39 修改

阅读量9.2k

点赞数 20

分类专栏：深度学习文章标签：重参数化 VAE

于 2023-10-22 11:03:34 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45732909/article/details/133970556

版权

深度学习专栏收录该内容

37 篇文章

订阅专栏

“Reparameterization trick”（重参数化技巧）是一种在训练生成模型中处理随机性潜在变量的方法，特别常见于变分自动编码器（VAE）等模型中。这个技巧的目的是使模型可微分（differentiable），以便使用梯度下降等反向传播算法来训练模型，也就是将随机采样的过程转换为可导的运算，从而使得梯度下降算法可以正常工作。
以下是它的基本原理和操作：

背景：在生成模型中，通常会有一个随机性的潜在变量，例如高斯分布中的均值和方差，用于生成样本。这会导致问题，因为采样操作是不可微的，无法通过反向传播来更新梯度，从而让模型学习这些分布参数。
重参数化：为了解决这个问题，“Reparameterization trick” 提出将随机采样操作从网络中移动到一个确定性函数中。这个确定性函数通常是一个线性变换，将从标准高斯分布（均值为0，方差为1）中采样的随机噪声与潜在变量的均值和标准差相结合。这个确定性函数是可微分的，因此梯度可以在这个过程中传播。
具体操作：在实际操作中，首先从标准高斯分布中采样一个随机噪声向量（通常记作𝝐）。然后，通过一个神经网络或其他可微分的映射函数，将这个随机噪声向量与模型的均值和标准差参数相结合，生成最终的潜在变量。这个潜在变量被用于生成样本，同时也与损失函数相关联，使得可以通过反向传播来更新梯度。

我是在看Variational Bipartite Graph Encoder的时候看到作者有这样一个操作，如下，当时觉得很奇怪。在这里插入图片描述

上面(3)式子，和VAE的讲解结合起来看看，貌似能理解了。首先 Z 服从 N(μ,σ²)的话，大学概率论都学过，那么ε = $\frac{(Z-μ)}{σ}$ 就服从标准正态分布了，也就是 ε 服从标准正态分布N(0, 1)。
ε = $\frac{(Z-μ)}{σ}$ 左边的等式变式一下，就有Z = μ + ε × σ了，那么从 N(μ,σ²)采样一个Z，相当于从从标准正态分布N(0, 1)采样一个 ε 。这样就将随机采样的过程转换为可导的运算，可以进行反向传播了。
我的例子是一个随机变量的正态分布，到了多维正态分布 Z ~ N(μ, Σ) = N(μ, I)的情况应该同理。

总之，“Reparameterization trick” 允许模型在训练过程中通过随机采样得到的潜在变量，同时保持了可微性，从而使生成模型更容易优化。这个技巧在生成对抗网络（GANs）、变分自动编码器（VAE）和其他生成模型中广泛应用。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

重剑DS 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。