【机器学习】 概率有向图模型

在这里插入图片描述
在这里插入图片描述
【贝叶斯网络】
在这里插入图片描述
在这里插入图片描述
【贝叶斯定理】
贝叶斯定理可以体现先验概率和后验概率之间的转换。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
【有向分离】
有向分离对应于概率论中的条件独立性,其目的是从图的角度出发寻找节点之间的条件独立性。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
比如对于下图:
在这里插入图片描述
xi=a, xj=b
则z={e,f}, l=a-e-f-b
l中有一个头对头节点e,和一个尾对尾节点f,满足条件2,所以l是关于z的一条阻断路径,a和b被{e,f}有向分离。

在这里插入图片描述
在这里插入图片描述
比如就上图而言,X={a}, Y={b}, Z={f}
XUYUZ = {a,b,f}
-XUYUZ = {e,c}
删除{e,c}中的叶子节点(出度为0的节点)c,然后e
删除从f输出的所有边,则a和b在新的有向无环图G‘中无连接路径,所以a和b被f有向分离。

再比如:X={a}, Y={b}, Z={e}
XUYUZ = {a,b,e}
-XUYUZ = {f,c}
删除{f,c}中的叶子节点(出度为0的节点)c
删除从e输出的所有边,则a和b在新的有向无环图G‘中无连接路径,所以a和b被e有向分离。

再比如: X={a}, Y={b}, Z={c}
XUYUZ = {a,b,c}
-XUYUZ = {e,f}
删除{e,f}中的叶子节点{}
删除从c输出的所有边,则a和b在新的有向无环图G‘中有连接路径,所以a和b没有被c有向分离。

【注意】:有向分离对应于条件独立,当结构图中X和Y被Z有向分离时,X和Y必然关于Z条件独立;但是当X和Y关于Z条件独立时,X和Y不一定被Z有向分离。
在这里插入图片描述

【贝叶斯网络结构学习】

从给定的数据集中学出贝叶斯网络结构,即各节点之间的依赖关系;只有确定了结构才能学习网络参数,即表示各节点之间依赖性的条件概率。
根据训练数据是否存在缺失分为完整数据结构学习和缺失数据结构学习。

1.完整数据结构学习
1.1基于搜索评分的方法

贝叶斯网络结构学习问题看成是优化问题,通过给定结构的评分函数,利用搜索算法,去寻找评分最优的网络结构。关键在于确定合适的搜索策略和确定评分函数。
在这里插入图片描述
在这里插入图片描述
给定训练数据D和一个可能的结构G,计算其评分f(G,D)。
评分函数分为:基于贝叶斯的评分和基于信息论的评分。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
两种方法的比较:基于贝叶斯的评分函数能够更好地区分训练样本较大的贝叶斯网络结构,基于信息论的评分函数适用于小样本的训练数据。

总结:
基于搜索评分的方法首先是定义评分函数,然后采用启发式或元启发式搜索方法来寻找最高的评价值。

搜索算法主要有以下几种:

  • K2算法:是基于贪婪搜索的结构学习算法,采用CH评分来衡量结构的优劣性,利用节点序以及正整数u来限制搜索空间的大小。
  • 爬山算法:根据评分确定是否采用加边、减边以及删除边的局部操作,通过贪婪选择来判断是否对模型结构进行更新。搜索过程简单,但无法保证搜索到的结构一定是最优的。
  • GES算法:从一个空图出发,采用两个不同的搜索阶段来寻找评分最优的结构。第一个阶段是词啊用贪心前向搜索法(GFS)来不断地在空图中加边,直至评分值无法提高为止;第二个阶段是利用贪心反向搜索法(GBS)在图中不断地删除边,直到评分值不能提高为止。也就是说,GES是采用了贪心前向搜索法和贪心反向搜索法不断地加边和减边来确定网络的结构的。
  • 基于进化计算的方法。
1.2基于约束的方法

通过统计独立性测试来学习结点间的独立性和相关性,并根据独立性或相关性构建出相应的有向无环图结构。
为了学习出结点间的独立性关系,基于约束的方法通常采用渐进统计检验(CI)来进行测试其独立性。
PC算法:通过寻找节点X的父节点和子节点集合pc(X),以及寻找v-结构来学习DAG(有向无环图)结构。
TPDA算法:是一种基于三层独立性测试的结构学习方法,分为三步:1.制定(从一个空图出发,通过简单的互信息测试来产生一组初始边,从而形成一个单连接的无环图);2.增厚(通过CI测试检查每对节点间是否能被有向分离,如果不能,则为其添加边);3.变薄(对图中的每条边进行检查,通过判断其对应的节点对之间是否条件独立,来决定是否移除边)

两种结构学习方法的局限
基于搜索评分的方法复杂度高,当节点较多时,会使搜索空间巨大,从庞大的搜索空间中搜索最优结构耗时;
基于约束的方法对于数据的要求性较高,需要训练数据无噪声且真实,训练数据量需要足够大。
所以提出了混合约束和搜索评分的结构学习方法
思想:通过独立性测试来降低搜索空间的大小,再利用搜索评分的方法来寻找最优的网络结构。典型的方法是MMHC(最大最小爬山算法)算法:将局部学习、CI测试以及搜索评分方法进行融合,通过采用独立性测试来学习出结构的框架,然后采用搜索评分的方式来确定网络中的边以及边的方向。

2.缺失数据结构学习

在缺失数据下学习网络结构,所有评分函数无法分解成只与局部结构相关的因式,需要执行非线性的优化过程,为评判当前网络结构必须评估其所有的邻居。
EM算法:高效地从不完整的数据条件下学习网络参数,具有较高的精度,一般是收敛到局部最优结构。
SEM算法:只对当前选中的网络结构使用EM算法,进行概率分布评估;对于未被选中的网络并不适用EM算法。每评价一个当前网络的邻居集,只调用一次EM算法,节省了计算开销。是EM算法的一个改进算法

【贝叶斯网络参数学习】
贝叶斯网络主要是处理离散数据,因此在参数学习的过程中,通常假设网络中变量的状态是离散的或者是呈现高斯分布。但在实际应用中,节点变量通常是不满足高斯分布的,通常可以采用等频率或者等区间的离散型方法对训练数据进行离散化。
当训练数据中所有变量状态都可观测时,可以用贝叶斯方法和最大似然估计法来学习参数;当训练数据中某些节点变量的状态未必能观测的时候,采用EM算法进行参数估计。

【隐马尔可夫模型(HMM)】
隐马尔可夫模型描述由马尔可夫链随机生成观测序列的过程,属于生成模型。它是结构简单的动态贝叶斯网,是一种有向图模型,在语音识别、自然语言处理以及生物信息等领域具有广泛的应用价值。
马尔可夫过程是具有马尔可夫性质的离散随机过程。
每个状态只依赖于之前的n个状态,这个过程被称为n阶模型,其中n是影响转移壮态的数目。
最简单的马尔可夫过程就是一阶过程,每一个状态的转移只依赖于其之前的那一个状态。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
可以用动态规划或置信度传播求解。

参考资料:机器学习-北京理工大学-中国大学mooc

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值