第十七课.有向图模型与条件独立性


本篇介绍有向图模型,即贝叶斯网络

有向图对概率模型的表达

概率图模型将抽象的图赋予了概率的含义,而概率图模型的核心是多维随机变量的联合概率分布 p ( x 1 , x 2 , . . . , x p ) p(x_{1},x_{2},...,x_{p}) p(x1,x2,...,xp)的计算,高维是导致使用链式法则的原因,现在要基于有向图,思考利用条件独立性化简表达。贝叶斯网络表达的概率模型如下:
fig1
有向图中,每个节点代表的都是随机变量的特征,父子节点之间的连接则表达了条件概率,它反映了父子节点之间的关系,比如:
fig2
可见, x i x_{i} xi x j x_{j} xj的父节点,因此这个图中 x i x_{i} xi x j x_{j} xj两个节点以及二者之间的有向关系表示为条件概率 p ( x j ∣ x i ) p(x_{j}|x_{i}) p(xjxi)

贝叶斯网络的三种基本结构

实际上,在贝叶斯网络中,无论节点有多少,网络有多复杂,本质还是由三类基本结构组成:

第一类:tail to tail结构
fig3
第二类:head to tail结构
fig4
第三类:head to head结构
fig5

贝叶斯网络对联合概率的拆解

此处需要借助有向图中的一个定义:有向图的因子分解公式,利用它我们可以在有向图中将联合概率拆解为若干条件概率连乘的形式:
p ( x 1 , x 2 , x 3 , . . . , x p ) = ∏ i = 1 p p ( x i ∣ x p a ( i ) ) p(x_{1},x_{2},x_{3},...,x_{p})=\prod_{i=1}^{p}p(x_{i}|x_{pa(i)}) p(x1,x2,x3,...,xp)=i=1pp(xixpa(i))
而其中的 x p a ( i ) x_{pa(i)} xpa(i) x i x_{i} xi的父节点集合。

因子分解公式套用在之前的六个节点的贝叶斯网络中,联合概率表达为:
p ( x 1 , . . . , x 6 ) = p ( x 1 ) p ( x 2 ∣ x 1 ) p ( x 3 ) p ( x 4 ∣ x 1 ) p ( x 5 ∣ x 2 , x 3 ) p ( x 6 ∣ x 5 ) p(x_{1},...,x_{6})=p(x_{1})p(x_{2}|x_{1})p(x_{3})p(x_{4}|x_{1})p(x_{5}|x_{2},x_{3})p(x_{6}|x_{5}) p(x1,...,x6)=p(x1)p(x2x1)p(x3)p(x4x1)p(x5x2,x3)p(x6x5)
我们进一步探索因子分解公式,实际可以在贝叶斯网络拓扑中,找到条件独立性。

还是在三个基本结构中看:

首先是tail to tail结构:
fig6
按照因子分解,联合概率写为: p ( a , b , c ) = p ( a ) p ( b ∣ a ) p ( c ∣ a ) p(a,b,c)=p(a)p(b|a)p(c|a) p(a,b,c)=p(a)p(ba)p(ca)

如果用链式法则表达,则为: p ( a , b , c ) = p ( a ) p ( b ∣ a ) p ( c ∣ a , b ) p(a,b,c)=p(a)p(b|a)p(c|a,b) p(a,b,c)=p(a)p(ba)p(ca,b)

联立两式子: p ( a ) p ( b ∣ a ) p ( c ∣ a ) = p ( a ) p ( b ∣ a ) p ( c ∣ a , b ) p(a)p(b|a)p(c|a)=p(a)p(b|a)p(c|a,b) p(a)p(ba)p(ca)=p(a)p(ba)p(ca,b),从而有: p ( c ∣ a ) = p ( c ∣ a , b ) p(c|a)=p(c|a,b) p(ca)=p(ca,b)

对比前面的章节,这正是条件独立的表达,在 a a a给定后, c c c b b b无关,相互独立;

现在分析head to tail结构:
fig7
按照因子分解为: p ( a , b , c ) = p ( a ) p ( b ∣ a ) p ( c ∣ b ) p(a,b,c)=p(a)p(b|a)p(c|b) p(a,b,c)=p(a)p(ba)p(cb),与链式法则联立得到: p ( c ∣ b ) = p ( c ∣ a , b ) p(c|b)=p(c|a,b) p(cb)=p(ca,b)

最后是head to head结构:
fig8
因子分解为: p ( a , b , c ) = p ( a ) p ( b ) p ( c ∣ a , b ) p(a,b,c)=p(a)p(b)p(c|a,b) p(a,b,c)=p(a)p(b)p(ca,b),联立链式法则为: p ( b ) = p ( a ∣ b ) p(b)=p(a|b) p(b)=p(ab),此处结论反映的是 a a a b b b相互独立。

贝叶斯网络与概率模型的关系

对比之前的内容,朴素贝叶斯其实是最简单的贝叶斯网络:
fig9
随机过程的马尔科夫链也是一种贝叶斯网络:
fig10

  • 4
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值