Householder Flow

最新推荐文章于 2021-12-23 16:40:24 发布

风吹草地现牛羊的马

最新推荐文章于 2021-12-23 16:40:24 发布

阅读量583

点赞数 2

分类专栏：变分贝叶斯系列机器学习主题模型（topic model）文章标签： 1024程序员节

本文链接：https://blog.csdn.net/mch2869253130/article/details/107367539

版权

机器学习同时被 3 个专栏收录

97 篇文章 5 订阅

订阅专栏

变分贝叶斯系列

22 篇文章 12 订阅

订阅专栏

主题模型（topic model）

11 篇文章 1 订阅

订阅专栏

Householder Flow

变分自动编码器(VAE)是可扩展的、强大的生成模型。然而，变分后验的选择决定了VAE的可操作性和灵活性。一般来说，潜变量是用一个对角协方差矩阵的正态分布建模的。这可以提高计算效率，但通常不能灵活地匹配真实的后验分布。丰富变分后验分布的一种方法是应用正则化流，即normalizing ﬂows。这种操作是对潜变量的简单后验分布做一系列可逆变换，将其变为复杂，灵活的后验分布。Householder Flow就是normalizing ﬂows中的一种。

数学原理

1. 随机变量的函数的概率密度
已知 $\sim p_{X}(x), Y = f(X)，f(X)是可逆函数，求Y的概率密度函数p_{Y}(y)？$
连续型随机变量的概率分布函数的形式是
$F_{X}(x) = p(X<x)=\int_{-\infty}^{x}p(t)dt$
假如 $f (x)$ 为增函数：
$F_{Y}(y) =p(Y<y)=p(f(X)<y)=p(X<f^{-1}(y)) \\ = F_{X}(f^{-1}(y))$

$p_{Y}(y) = {dF_{Y}(y) \over dy} = {dF_{X}(f^{-1}(y)) \over dy} =p(f^{-1}(y)){df^{-1}(y) \over dy} \\ 也可以写成: \\ p_{Y}(y) = p(x){dx \over dy}$
假如 $f (x)$ 为减函数：
$F_{Y}(y) =p(Y<y)=p(f(X)<y)=p(X>f^{-1}(y)) \\ =1- F_{X}(f^{-1}(y))$

$p_{Y}(y) = {dF_{Y}(y) \over dy} = {d(1-F_{X}(f^{-1}(y))) \over dy} =-p(f^{-1}(y)){df^{-1}(y) \over dy} \\ 也可以写成: \\ p_{Y}(y) = -p(x){dx \over dy}$
所以综上：
$\tag{1} p_Y(y)=p(f^{-1}(y))|{df^{-1}(y) \over dy}| 或者p(x)|{dx \over dy}|$

上面括号内部用到了求解不等式的方法， $f (X) < y$ 就相当于解不等式，当 $f$ 是增函数时，不等式的解是 $X<f^{-1}(y)$ ，当 $f$ 是减函数时，不等式的解是 $X>f^{-1}(y)$ ，不理解的同学可以用一元一次不等式手动理解一下。

2. Normalization flow

对（1）式变形
$\over dy}| = p(x)|{dx \over df(x)}|=p(x)|{df(x) \over dx}|^{-1}$
所以有下式成立：
$\sim p(x) \\ y = f(x) \\ y \sim p(y)=p(x)|{df \over dx}|^{-1}$
如果x是一个高维向量，那么就变成下式：
$\tag{2} y \sim p(y)=p(x)|det{df \over dx}|^{-1}$

$\over dx}|$ 是雅克比行列式的绝对值。

如果我们施加的一系列的 $f_{k}, k \in [1, K]$ ，那么就得到一个归一化流（normalizing ﬂows）：
$z_{K} = f_{K}*...*f_{1}(z_{0})，z_{0} \backsim q_{0}(z_{0}) \\ z_{K} \backsim q_{K}(z_{K}) = q_{0}(z_{0}) \prod_{k=1}^{K}|det{df_{k} \over dz_{k-1}}|^{-1}$

这一系列变换就可以将一个简单的概率分布变成一个复杂的概率分布。

3. LOTUS
LOTUS全称是law of unconscious statistician，具体规则就是：
$E_{q_K(z_{K})}[h(z_{K})]=E_{q_{0}(z_0)}[h( f_{K}*...*f_{1}(z_{0}))]$

也就是在关于 $h(z_{K})$ 求 $q_{K}(z_K)$ 的期望时，可以转为求 $q_0(z_0)$ 的期望。

ELBO

通过normalizing ﬂows，我们可以将变分后验变为如下：
$\tag{3}lnq_{K}(z_{K}) = lnq_{0}(z_{0}|x) -\sum_{k=1}^{K}ln|det{df_{k} \over dz_{k-1}}|$

VAE中的变分下界有两种形式：

在这里插入图片描述
或者：

第二种形式可以由第一种得到，我们看第一种形式，结合前面提到的LOTUS规则将变分下界(ELBO)变为：
在这里插入图片描述

Householder transformation

假设 $v$ 是一个与超平面正交的向量（Householder vector），那么Householder matrix $H$ 定义如下：
$I-2{vv^{T} \over |v|^{2}}$
$H$ 矩阵也是一个正交矩阵，所以其雅可比行列式的绝对值为1，也就是 $l n ∣ d e t H ∣ = 0$ 。
我们令 $f_{k} = H_{k}z_{k-1}$ ，那么（4）式中
在这里插入图片描述
所以（4）式中只需要计算两项。

因此，后验分布 $z_{0}$ 通过一系列的Householder transformation（被称作Householder Flows）转化为了 $z_{K}$ ，这样 $z_{K}$ 就可以看做是由一个复杂的分布中采样出来的，可以更加灵活的建模真实的后验分布。

风吹草地现牛羊的马

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
Householder Flow

Householder Flow变分自动编码器(VAE)是可扩展的、强大的生成模型。然而，变分后验的选择决定了VAE的可操作性和灵活性。一般来说，潜变量是用一个对角协方差矩阵的正态分布建模的。这可以提高计算效率，但通常不能灵活地匹配真实的后验分布。丰富变分后验分布的一种方法是应用正则化流，即normalizing ﬂows。这种操作是对潜变量的简单后验分布做一系列可逆变换，将其变为复杂，灵活的后验分布。Householder Flow就是normalizing ﬂows中的一种。推导设q(x)q(x)
复制链接

扫一扫