18 高斯网络

最新推荐文章于 2024-07-19 22:36:31 发布

hanhan不是很憨憨

最新推荐文章于 2024-07-19 22:36:31 发布

阅读量1k

点赞数

分类专栏：机器学习-白板推导文章标签：机器学习算法人工智能

本文链接：https://blog.csdn.net/weixin_50737833/article/details/131142756

版权

机器学习-白板推导专栏收录该内容

29 篇文章 0 订阅

订阅专栏

文章目录

18 高斯网络

18 高斯网络

18.1 高斯网络介绍

概率图模型可以分成主要的几部分：

Bayesian Network
Markov Network
Gaussian Network——连续性的概率图模型：
- Gaussian Bayesian Network
- Gaussian Markov Network

高斯网络的特点有：

假设每个节点通过 $x_i$ 表示图中的每个节点都服从高斯分布： $x_i \backsim N(\mu_i, \Sigma_i)$ 。
一张高斯图可以表示为 $X=(x_1, x_2, \dots, x_p)^T$ ，并且图与高维高斯分布对应：
$\frac{1}{(2\pi)^{\frac{p}{2}} {|\Sigma|}^{\frac{1}{2}}} \cdot \exp{\lbrace -\frac{1}{2}{(x-\mu)}^T \Sigma^{-1} (x-\mu) \rbrace}$
具有高斯分布的性质，已知 $\Sigma = (\sigma_{ij})_{p \times p}$ ：
$x_i \bot x_j \iff \sigma_{ij} = 0$
具有图的性质——条件独立性 $X_A \bot X_B | X_C$ ，定义精度矩阵 $\Lambda = \Sigma^{-1} = (\lambda_{ij})_{p \times p}$ （称为precision matrix/ information matrix），则条件独立性定义为：
$x_i \bot x_j|_{X-{\lbrace x_i, x_j \rbrace}} \iff \lambda_{ij} = 0$

18.2 Gaussian Bayesian Network——高斯有向图

高斯贝叶斯网络的案例——Kalman Filter：

链式的，特殊的GBN
和HMM相同， $\lambda = (\pi, A, B)$ ，同时满足高斯：
$\begin{cases} x_t| x_{t-1} \backsim N(x_t| Ax_{t-1} + B, Q) \\ y_t| x_t \backsim N(y_t| Cx_t + D, R) \end{cases}$
和线性：
$\begin{cases} x_t = A x_{t-1} + B + \varepsilon, \quad \varepsilon \backsim N(0, Q) \\ y_t = C x_{t} + D + \sigma, \quad \sigma \backsim N(0, R) \\ \end{cases}$

GBN的因子分解：

Bayesian Network的性质有一条因子分解：
$\prod_{i=1}^p P(x_i | x_{pa(i)})$
GBN(global model)基于线性高斯模型(local model)：
$\begin{cases} P(x) = N(x|\mu_x, \Sigma_x) \\ p(y|x) = N(y|Ax+B, \Sigma_y) \end{cases}$
在 $x_i$ 是一维的情况下，可以得到：
$\begin{align} &\begin{cases} P(x) = \prod_{i=1}^p P(x_i | x_{pa(i)}) \\ x_{pa(i)} = {(x_1, x_2, \dots, x_K)}^T \end{cases} \\ \implies &\begin{cases} x_i| x_{pa(i)} \backsim N(x_i| \mu_i + w_i^T x_{pa(i)}, \sigma_i^2) \\ x_i - \mu_i = \sum_{j \in x_{pa(i)}} {w_{ij}(x_j - \mu_j) + \sigma_i\varepsilon_i}, \quad \varepsilon_i \backsim N(0, 1) \end{cases} \end{align}$
可以一看的出来 $i, j$ 之间有线性关系，实际上是线性高斯模型。化成 $x_i - \mu_i$ 的形式是为了简化运算，因为这样等同于将Gaussian Disk平移到了原点。

18.3 Gaussian Markov Network——高斯无向图

高斯马尔可夫网络的因子分解：

目前有什么条件呢：
$\begin{cases} p(x) = \frac{1}{(2\pi)^{\frac{p}{2}} {|\Sigma|}^{\frac{1}{2}}} \cdot \exp{\lbrace -\frac{1}{2}{(x-\mu)}^T \Sigma^{-1} (x-\mu) \rbrace} \\ p(x) = \frac{1}{Z} \prod_{i=1}^p \underbrace{\varphi_i(x_i)}_{\text{node potential}} \cdot \prod_{i, j \in x} \underbrace{\varphi_{i, j}(x_i, x_j)}_{\text{edge potential}} \end{cases}$
我们的目的是将他们结合起来，我们来看一下上面的公式有什么性质（已知 $(x_1, x_2, \dots, x_p)^T, \Lambda = \Sigma^{-1} = {(\lambda_{ij})}_{p \times p}$ ，且 $\Sigma$ 为对称矩阵）：
$\begin{align} p(x) &\propto \exp{\lbrace -\frac{1}{2}{(x-\mu)}^T \Sigma^{-1} (x-\mu) \rbrace} \\ &= \exp{\lbrace -\frac{1}{2} (x^T \Lambda x - \underbrace{x^T \Lambda \mu}_{1 \times 1} - \underbrace{\mu^T \Lambda x}_{1 \times 1} + \mu^T \Lambda \mu) \rbrace} \\ &= \exp{\lbrace -\frac{1}{2} (x^T \Lambda x - 2 \mu^T \Lambda x + \underbrace{\mu^T \Lambda \mu}_{与x无关}) \rbrace} \\ &\propto \exp{\lbrace \underbrace{-\frac{1}{2} x^T \Lambda x}_{二次项} - \underbrace{{(\Lambda \mu)}^T x}_{一次项} \rbrace} \\ \end{align}$
其中我们将 $\Lambda$ 称为precisian matrix， $\Lambda \mu$ 称为potential vector，且假设 $\Lambda \mu = h = {(h_1, h_2, \dots, h_p)}^T$ ：
我们在Markov Network中的node potential与 $x_i$ 相关，edge potential与 $x_i, x_j$ 相关，所以从上文中可以发现在Gaussian中势函数所表示的东西：
与 $x_i$ 相关（有 $x$ 的项都可以）：
$x_i: {-\frac{1}{2} x_i^2 \lambda_{ii}} - {h_i x_i}$
与 $x_i, x_j$ 相关（必须是二次项，且要考虑两种顺序）：
$x_i, x_j: {-\frac{1}{2}} ({\lambda_{ij} x_i x_j} + {\lambda_{ji} x_j x_i}) = -{\lambda_{ij} x_i x_j}$

总结一下GMN的性质：

在Gaussian中——绝对独立（marginal independent）：
$x_i \bot x_j, \Sigma = (\sigma_{ij}) \iff \sigma_{ij} = 0$
在上文中得出的条件独立——条件独立：
${x_i \bot x_j|}_{- {\lbrace x_i, x_j \rbrace}}, \Lambda = \Sigma^{-1} = (\lambda_{ij}) \iff \lambda_{ij} = 0$
在任意无向图中：
$\forall x_i, \underbrace{{x_i|}_{-{\lbrace x_i \rbrace}}}_{条件概率分布} \backsim N(\sum_{j \neq i} \frac{\lambda_{ij}}{\lambda_{ii}} x_j, \lambda_{ii}^{-1})$
可以发现 $x_i$ 可以看作与之相连的 $x_j$ 的线性组合

hanhan不是很憨憨

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
18 高斯网络

Gaussian Network——连续性的概率图模型：高斯网络的特点有：假设每个节点通过xix_ixixi∽NμiΣixi∽NμiΣi。一张高斯图可以表示为Xx1x2xpTXx1x2xpTpx12πp2∣Σ∣12⋅exp⁡−12x−μTΣ−1x−μpx2π2p∣Σ∣211⋅exp−21x。
复制链接

扫一扫