周志华机器学习笔记-C14

最新推荐文章于 2024-10-03 15:58:53 发布

Guy Black

最新推荐文章于 2024-10-03 15:58:53 发布

阅读量148

点赞数 1

分类专栏：周志华《机器学习》笔记文章标签：机器学习笔记人工智能

本文链接：https://blog.csdn.net/weixin_61986755/article/details/142692710

版权

周志华《机器学习》笔记专栏收录该内容

15 篇文章 0 订阅

订阅专栏

概率图模型

另一种看待机器学习的方法，不是“从样例学习”，而是从概率意义上根据已知变量信息“推断”未知变量出现概率。

一、机器学习与概率推断

1、概率推断：机器学习重要目的是根据已知（训练样本）对未知（如标记）进行估计和推测，在概率框架下的表达为：利用已知变量推测未知变量分布（后取最概率意义下有可能的取值作为结果）。

2、概率模型：在概率框架下，变量均被理解成彼此具有一定关联、服从一定分布的随机变量。由此，推断目标即未知变量在已知变量下的条件分布，当然，可能还有其他无关变量，一般无法直接求得该条件分布，而必须从建立的概率模型中进一步推断。概率模型有“生成式”（所有变量联合分布）与“判别式”（未知变量在已知变量与无关变量下的分布）

3、概率图模型：以图表示变量相关关系的模型，分为有向图（贝叶斯网）与无向图（马尔科夫网）。

二、典型概率图模型

1、生成式有向图模型——隐马尔科夫模型HMM：结构如图，讨论状态变量yi（不可观测）观测变量xi取离散值的情况。该模型的结构信息可以表述如下：一个状态仅依赖于前一个状态，与其他任何状态无关。联合分布表达如下。

根据结构信息，需三组参数能描述分布式模型（联合分布）：状态转移概率、输出观测概率、初始状态概率。

HMM关注三个问题，目前均能高效求解：给定模型，求解产生特定序列xi的概率；给定模型与产生序列，推断状态序列；调整模型参数使得给定观测序列出现概率最大。

2、生成式无向图模型——马尔科夫随机场MRF：认为多变量之间联合概率能基于（极大）团分解为多因子乘积，该因子又称势函数。其中，团指变量间均有关系的（均相连）的变量集子集，而极大团则是与其他团没有包含关系的团。该随机场有比较便捷的条件独立性，表现为全局马尔可夫性：给定分离集取值，则被分离的两个变量子集条件独立。