Machine Learning-L17-贝叶斯网络

1. 基本概念

贝叶斯网络(Bayesian network)又称信念网络(belief network),使用**有向无环图(Directed Acyclic Graph)来表示变量间的依赖关系,并使用条件概率表(CPT,Conditional Probability Table)**描述属性的联合概率分布。

贝叶斯网络表示为 N = ( G , Θ ) N=(G,\Theta) N=(G,Θ)

  • G = ( V , E ) G=(V,E) G=(V,E)表示结点关系的有向无环图,即贝叶斯网络结构。
  • Θ = { θ 1 , θ 1 , . . . θ n } \Theta = \{\theta_1,\theta_1,...\theta_n\} Θ={θ1,θ1,...θn}表示每个结点 V i V_i Vi在它父结点集 p a ( X i ) pa(X_i) pa(Xi)条件下的条件概率,即贝叶斯网络参数。

两个重要条件独立性:

  • 结点与其非后代结点条件独立
  • 给定一个结点的马尔可夫覆盖,这个结点和网络所有其他结点条件独立

特点:

  • 一种不定性因果关联模型
  • 具有强大的不确定性问题处理能力
  • 具有良好的可理解性和逻辑性
  • 结合先验知识,用图形化模型描述数据间的相互关系便于分析预测
  • 能有效进行多元信息融合与表达

e.g

  • Difficulty (课程的难度): 取值0(低难度)和1(高难度)
  • Intelligence(智力水平): 取值0(低)和1(高)
  • Grade(学生的上课成绩) : 取值1(好成绩),2(平均成绩)和3(成绩差)
  • SAT (SAT考试成绩): 取0(低分)和1(高分)
  • Letter(完成课程后学生从教授那里得到推荐信的质量) : 取0(不是好信)和1(好信)

图中的边包含变量的依赖关系(箭头的方向表示因果关系)

  • Grade 取决于课程的Difficulty和学生的Intelligence
  • Grade 决定了学生是否从教授那里得到了一封好的Letter
  • 除影响Grade外,学生的Intelligence还影响他们的SAT分数

Grade有两个父节点,条件概率 p ( G r a d e = g ∣ D i f f i c u l t y = d , S A T = s ) p(Grade=g | Difficulty=d, SAT=s) p(Grade=gDifficulty=d,SAT=s)表示在Difficulty=gSAT=s的条件下,Grade=g的概率是多少。

2. 有向分离

有向分离对应概率论中的条件独立性,目的在于从图的角度寻找结点之间的条件独立性。
三类特殊的结点连接,分别为顺序连接、发散连接、收敛连接。
在这里插入图片描述
其中结点c分别称为头对尾结点(head-to-tail)、尾对尾结点(tail-to-tail)和头对头结点(head-to-head)。

根据条件独立知识:在顺序连接和发散连接中,

当 前 结 点 c 的 状 态 { 未 知 情 况 下 , a 和 b 之 间 存 在 相 关 性 已 知 情 况 下 , a 和 b 之 间 关 于 c 条 件 独 立 ( 即 a 和 b 被 c 有 向 分 离 ) 当前结点c的状态\begin{cases} 未知情况下,a和b之间存在相关性 & \\ 已知情况下,a和b之间关于c条件独立(即a和b被c有向分离) & \end{cases} c{ababcabc

对于贝叶斯网络 N = ( G , Θ ) N=(G,\Theta) N=(G,Θ) X i X_i Xi X j X_j Xj G G G中任意不相邻的两个结点, Z Z Z表示连接 X i X_i Xi X j X_j Xj路径上的结点集,并且不不包含 X i X_i Xi X j X_j Xj l l l是连接 X i X_i Xi X j X_j Xj的任意路径。如果 Z Z Z满足以下条件之一,则称** l l l是关于 Z Z Z的一条阻断路径**, X i X_i Xi X j X_j Xj Z Z Z有向分离,记作 d e s p G ( X i , Z , X j ) desp_G(X_i, Z ,X_j) despG(Xi,Z,Xj)

  • Z Z Z包含 l l l中不同于 X i X_i Xi X j X_j Xj的某一头对尾结点。
  • Z Z Z包含 l l l中不同于 X i X_i Xi X j X_j Xj的某一尾对尾结点。
  • Z Z Z不包含 l l l中不同于 X i X_i Xi X j X_j Xj的某一头对头结点及其子孙结点。

结点集之间的有向分离
假设 A , B , Z A,B,Z A,B,Z是在 G G G中的三个互补相交的结点集,对于任意的结点 A i ∈ A A_i \in A AiA和任意 B i ∈ B B_i \in B BiB,若 A i A_i Ai B i B_i Bi Z Z Z有向分离,则称 A A A B B B Z Z Z有向分离,记作 d e s p G ( A , Z , B ) desp_G(A,Z,B) despG(A,Z,B)

定理:判定 G G G中结点集 X X X Y Y Y是否被 Z Z Z有向分离 等价于 X X X Y Y Y是否在新的有向无环图 G ′ G' G无连接路径。
通过定理,可以将有向图简化为非连接图,这样在线性时间内判断是否满足有向分离,从而降低分析的复杂度。

对于贝叶斯网络 N = ( G , Θ ) N=(G,\Theta) N=(G,Θ)

  • X X X Y Y Y Z Z Z有向分离,则对于任意网络参数 Θ \Theta Θ X X X Y Y Y关于 Z Z Z条件独立
  • X X X Y Y Y不被 Z Z Z有向分离,则 X X X Y Y Y关于 Z Z Z条件独立取决于网络参数 Θ \Theta Θ

3. 贝叶斯网络结构学习

从给定的数据集中学习出贝叶斯网络结构,即各结点之间的依赖关系,只有确定了结构才能学习网络参数,即表示各结点之间依赖性的条件概率。

根据训练数据是否存在缺失,网络结构学习分为

  • 完整数据结构学习
    • 基于搜索评分的方法:贝叶斯网络结构学习问题看成是优化问题,通过给定结构的评分函数(基于贝叶斯评分/基于信息论评分),利用搜索算法(K2/爬山/GES/基于进化计算),寻找评分最优的网络结构。

    • 基于约束的方法:通过统计独立性测试来学习结点间的独立性和相关性,并根据独立性或相关性构建出相应的有向无环图结构。

基于信息论的评分函数:将学习问题看做一个数据压缩任务,使用最小描述长度(MDL,Minimum Description Length)为优化目标。编码长度包括了描述模型自身所需的字节长度和使用该模型描述数据所需的字节长度。

  • 缺失数据结构学习
    • 修复数据集的方法
    • 近似计算的方法

4. 贝叶斯网络参数学习

贝叶斯网络参数学习(参数估计):在给定网络结构的基础上,从训练数据中学习得到结点的条件概率分布的过程。

贝叶斯网络主要是处理离散数据,因此在参数学习的过程中,通常假设网络中变量的状态是离散的或者呈现高斯分布。实际应用中,结点变量一般是不满足高斯分布的,通常可以采用等频率或者等区间的离散型方法对训练数据进行离散化。

训练数据中所有变量都可观测:

  • 贝叶斯估计(BE,Bayesian Estimation)
  • 最大似然估计(MLE,Maximum Likelihood Estimation):实例数据完备的情况下的学习方法,依据参数与数据集的似然程度来选择参数。

某些结点变量的状态未必能观测

  • 近似方法:Monte-Carlo方法/高斯毕竟/Laplace近似/EM算法求极大似然/MAP
  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
 第四冊 第十七課 テスト 一 次の単語の正しい読み方を、平仮名で(  )に書きなさい。1×10=10点 1.展望(  ) 2.条約(  )  3.基礎(  ) 4.一衣帯水(  ) 5.前途(  ) 6.前方(  ) 7.本誌(  ) 8.協定(  ) 9.総合(  ) 10.用水路(  ) 二 次の単語の正しい漢字を、(  )に書きなさい。1×10=10点 11.うながす(   ) 12.せいか(   ) 13.せっち(  ) 14.ろうどうりょく(  ) 15.かんり(  ) 16.のぞましい(  ) 17.しんりゃくせんそう(  ) 18.よろこばしい(  ) 19.けんぜん(  ) 20.ゆうり(  ) 三 次の文の   に入れるのに最も適当な言葉を後の1.2.3.4から一つ選びなさい。2×15=30点 21.平等互惠などの五原則を______に、世界各国との友好関係を発展させます。。 ①基礎   ②きっかけ  ③初め  ④機会 22.あの子はもうすこし心を勉強に____といいね。 ①向く  ②付く  ③付ける  ④向ける 23.収入の二割を貯金に____ようにとおもったが、でも無理のようだ。。 ①出す  ②出る  ③向く  ④向ける 24.これを自分への試練____考えている。。 ①に  ②で  ③を  ④と 25.新しい工場の建設_____、廃水処理に対する検討が必要である。。 ①にあたって  ②に対して  ③にとって  ④に関して

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

隐私无忧

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值