PRML读书笔记——图模型

最新推荐文章于 2024-04-30 20:22:08 发布

GZGlenn

最新推荐文章于 2024-04-30 20:22:08 发布

阅读量5.3k

点赞数 3

分类专栏：机器学习文章标签：图模型马尔科夫随机场贝叶斯网络 PRML

本文链接：https://blog.csdn.net/hubin232/article/details/70171507

版权

本章主要分析贝叶斯网络、条件独立、马尔科夫随机场和图模型的推断

0 前言

概率图模型：用概率分布的图形表示变量之间的依赖关系

⼀个图由结点（nodes）和它们之间的链接（links）组成。在概率图模型中，每个结点表⽰⼀个随机变量（或⼀组随机变量），链接表⽰这些变量之间的概率关系。这样，图描述了联合概率分布在所有随机变量上能够分解为⼀组因⼦的乘积的⽅式，每个因⼦只依赖于随机变量的⼀个⼦集。

1 贝叶斯网络

贝叶斯网络是一个有向图模型，一个简单的示例如下：

这里写图片描述

就上图而言，链接的起点就是条件概率的条件中的随机变量对应的结果，因此上图对应概率形式可以表示如下：

p (x 1) p (x 2) p (x 3) p (x 4 | x 1, x 2, x 3) p (x 5 | x 1, x 3) p (x 6 | x 4) p (x 7 | x 4, x 5)

$p(x_{1})p(x_{2})p(x_{3})p(x_{4}|x_{1},x_{2},x_{3})p(x_{5}|x_{1},x_{3})p(x_{6}|x_{4})p(x_{7}|x_{4},x_{5})$

显然，真正传递出图表示的概率分布的有趣信息的是图中链接的缺失。

下面给出更一般的形式，对于一个有K个结点的图，联合概率为：

p (x) = \prod k = 1 K p (x k | p a k)

$p(x) = \prod_{k=1}^{K}p(x_{k}|pa_{k})$

其中， $pa_{k}$ 表示 $x_{k}$ 的父结点的集合， $x=\left \{ x_{1},...,x_{k} \right \}$ 。这个关键的方程表示有向图模型的联合概率分布的分解属性。

这里，贝叶斯网络对应的有向图是有向无环图（DAG）。这等价于存在一个对所有点的排序，使得不存在从某个结点到序号较小的结点的链接。

多项式回归的例子

多项式回归的概率形式为：

p (t, w | x, α, σ 2) = p (w | α) \prod n = 1 N p (t n | w, x n, σ 2)

$p(t,w|x,\alpha,\sigma ^{2})=p(w|\alpha)\prod_{n=1}^{N}p(t_{n}|w,x_{n},\sigma ^{2})$

一般而言，会用给对应结点加上阴影的方式表示观测变量。因此，以t为观测变量，上述概率形式用图模型表示如下：

这里写图片描述

生成式模型的例子

这里分析的是图模型与采样方法的关系。对应于⼀个有向⽆环图。我们假设变量已经进⾏了排序，从⽽不存在从某个结点到序号较低的结点的链接。换句话说，每个结点的序号都⼤于它的⽗结点。我们的⽬标是从这样的联合概率分布中取样 $\widehat{x_{1}},...,\widehat{x_{k}}$ 。这里，假设我们已知第一个样本的初始概率分布。那么，图模型对应的就是祖先采样。

祖先采样：我们⾸先选出序号最⼩的结点，按照概率分布 $p(x1)$ 取样，记作 $x_{1}$ 。然后，我们顺序计算每个结点，使得对于结点n，我们根据条件概率 $p(x_{n} | pa_{n})$ 进⾏取样，其中⽗结点的变量被设置为它们的取样值。注意，在每个阶段，这些⽗结点的变量总是可以得到的，因为它们对应于已经采样过的序号较⼩的结点。⼀旦我们对最后的变量 $x_{K}$ 取样结束，我们就达到了根据联合概率分布取样的⽬标。为了从对应于变量的⼦集的边缘概率分布中取样，我们简单地取要求结点的取样值，忽略剩余结点的取样值。