结构化概率模型

最新推荐文章于 2024-08-18 12:55:42 发布

奔跑的Yancy

最新推荐文章于 2024-08-18 12:55:42 发布

阅读量2.3k

点赞数 3

分类专栏：必要的数学知识必要的数学知识 in ML 文章标签：结构化概率概率模型机器学习概率分布

本文链接：https://blog.csdn.net/lyxleft/article/details/84931921

版权

本文探讨了在机器学习中如何使用结构化概率模型来有效地表示复杂的概率分布。通过因子分解，可以将多变量的概率分布转化为多个变量较少的因子乘积，减少描述分布所需的参数。介绍了有向和无向图模型，有向模型对应概率分布的直接作用，无向模型则用无向边表示变量间的相互影响。每个图的节点代表随机变量，边表示变量间的依赖关系。概率分布可以表示为各个因子的乘积，并通过归一化常数Z确保概率分布的合理性。

摘要由CSDN通过智能技术生成

机器学习的算法经常会涉及到在非常多的随机变量上的概率分布。通常，这些概率分布涉及到的直接相互作用都是介于非常少的变量之间的。使用单个函数来描述整个联合概率分布是非常低效的 (无论是计算上还是统计上)。

我们可以把概率分布分解成许多因子的乘积形式，而不是使用单一的函数来表示概率分布。例如，假设我们有三个随机变量 a, b 和 c，并且 a 影响 b 的取值，b 影响 c 的取值，但是 a 和 c 在给定 b 时是条件独立的。我们可以把全部三个变量的概率分布重新表示为两个变量的概率分布的连乘形式:

这种分解可以极大地减少用来描述一个分布的参数数量。每个因子使用的参数数目是它的变量数目的指数倍。这意味着，如果我们能够找到一种使每个因子分布具有更少变量的分解方法，我们就能极大地降低表示联合分布的成本。

我们可以用图来描述这种分解。这里我们使用的是图论中的 ‘‘图’’ 的概念:由一些可以通过边互相连接的顶点的集合构成。当我们用图来表示这种概率分布的分解，我们把它称为 结构化概率模型(structured probabilistic model)或者 图模型(graphical model)。