一贝叶斯网络核心思想
从局部信息推广全局的过程,现实中的任何分析是已经获得一定知识的前提下去做判断,即为条件概率,通过贝叶斯公式实现条件概率的求解。
(1)
其中第三个等式是贝叶斯公式的精髓,它存在两个意义(一)简化求解计算复杂度,直接采用公式二的联合概率密度求解假设为N个变量则需要列出表以获得联合概率的具体表示方式,若为条件概率密度则只需要N个表即可(二)实现了P(M/E)与P(E/M)的转换,即存在假设一个条件概率是难求的可以通过一个简单的概率可以获知,例如P(E=家庭收入超过两千/M=买一千块手机)的条件概率,比P(M=买一千块手机的条件概率/E=家庭收入超过两千/)难获得可以通过后者求解可得到。
二独立性判断
条件概率(1)可由联合概率密度求解,可以从联合概率密度分离出独立变量后简化计算难度,或者可以用第三个等式求解,若多个变量时条件概率密度的独立的计算难度会大大降低,所以独立性判断至关重要。D分离方法为有效的独立性判断手段,起将变量X,Y之间的连接方法划分为三种形式:
因果链条
共同原因
共同结果
会变色是连接变量X,Y的中间变量Z,灰色状态代表中间变量已知,白色是未知情况,判断标准为:
若则满足完全独立,若则代表给定Z的情况下X,Y之间条件独立,若不成立举反例即可。
对于这三种方式可以得到如下结论:
(一)对于因果变量,若中间变量未知,则X,Y变量不相互独立,若中间变量已知,则X,Y变量相互独立
(二)对于共同原因,若变量未知,则,则X,Y变量相互独立,若中间变量已知,则X,Y变量不相互独立
(二)对于共同结果,若变量未知,则,则X,Y变量相互独立,若中间变量已知,则X,Y变量不相互独立
二高效的贝叶斯网络构建
我们应该构建最高效的贝叶斯网络以最低的计算代价获得所需条件概率结果,如果采用非因果方式编码会导致变量之间的连接网络变复杂,计算代价大,构建高效贝叶斯网络的法则:原因节点现在结果节点前面并以小于结果节点的进行编写
二非离散型变量的处理
若输入是连续型变量则采用高斯函数对输入进行建模
若输入是连续型函数则采用sigmoid函数可以输出为布尔型变量
三贝叶斯网络的高效运算
如果采用从左至右算法进行计算会存在多个变量重复计算的情况,
(一)消元法
方法:我们一般采用以存数量换取计算代价从右向做进行计算后再进行求和,这样可以减少计算量,从左至右计算相当于宽度求解过程,从右向左计算,是模块点乘思想但是计算复杂度也不低,不同的排序会在过程中产生不同的因子
技巧:
删去非查询变量和证据变量祖先的变量的节点。
(二)聚类
将小类整合成大类进行计算即可