概率pca(probabilistic pca)的理解

最新推荐文章于 2024-04-08 16:01:32 发布

janehand

最新推荐文章于 2024-04-08 16:01:32 发布

阅读量1w

点赞数 8

本文链接：https://blog.csdn.net/janehong1314/article/details/84918269

版权

ppca原理

pca 可以从很多角度来理解，今天来谈一谈不太知名的ppca。所谓概率pca, 就是构建一个概率模型，对于一个数据 , 可以认为这样生成的， $x=wz+\mu +\sigma\cdot\epsilon$ , 是 $p\times q$ 维， p>q , 是均值为0，方差为 $_{Iq}$ 的维高斯随机向量， $\sigma > 0$ ， $\epsilon$ 是均值为0 , 方差为 $_{Ip}$ 的维高斯随机向量，和 $\epsilon$ 独立。 $w, \mu ,\sigma$ 是未知参数，把看成隐变量，对降维的结果，就是要求出它在低维空间的隐变量，但是隐变量是随机变量，因此我们要求得已知时的期望，即 E(z|x) ，这个模型可以看成一种特殊的高斯混合模型，求解方法也和GMM一样。

要求 E(z|x) ，我们就要求得 P(z|x) , 接下来涉及一系列概率计算。给定时， $x-\mu |z,\sigma \sim N(wz,\sigma^{^{2}}I_{p})$ , 将积分，可得 $x-\mu$ 全概率分布 $x-\mu \sim N(0,ww^{^{T}}+\sigma^{^{2}}I_{p})$ . 根据贝叶斯定理,

$p(z|x-\mu )\propto p(x-\mu |z)p(z)=$ $exp(\frac{-1}{2\sigma ^{^{2}}}(x-\mu -wz)^{T}(x-\mu -wz))exp(\frac{-1}{2}z^{T}z)$ ,

进行配方，保留和有关的项，得到

$p(z|x-\mu )\sim N(M^{-1}w^{T}(x-\mu ),\sigma ^{2}M^{-1})$ ,

其中 $M=\sigma ^{2}I_{q}+w^{T}w$ , 因此当已知后，的期望就是 $M^{-1}w^{T}(x-\mu )$ ，即的降维结果，剩下的问题就是如何求得 $w, \mu ,\sigma$ 这三个参数了，有两种方法可以用来求解，极大似然法和EM算法，用这两种求解都非常复杂。这里介绍最大似然的解法。

极大似然求解

将 $ww^{^{T}}+\sigma^{^{2}}I_{p}$ 记作 , 对数似然函数为: $\frac{1}{\left | C \right |^{n/2}} exp(\frac{-1}{2}\sum (x_{i}-\mu )^{T}C^{-1}(x_{i}-\mu ))$ , 和一般高斯分布的似然函数一样, 只是是参数的复合。写成log的形式：