贝叶斯分类算法

最新推荐文章于 2023-10-08 11:24:59 发布

古韦

最新推荐文章于 2023-10-08 11:24:59 发布

阅读量1.4k

点赞数

分类专栏： DataMining

DataMining 专栏收录该内容

18 篇文章 0 订阅

订阅专栏

贝叶斯分类是一种统计学分类方法，它利用已知样本的分类统计情况预测未知样本的分类。
p(H|X)=p(X|H)p(H)/p(X)

一、朴素贝叶斯分类工作过程：
1)每个数据样本用一个n维特征向量X={x1,x2,......xn}表示，分别描述对n个属性A1，A2.....An样本的n个度量。
2)假定有m个类C1,C2....Cm。给定一个未知的数据样本X，分类法将预测X属于具有最高后验概率的类。即是说，朴素贝叶斯分类将未知的样本分配给类ci,当且仅当
p(Ci|X)>p(Cj|X)

p(ci|x)=p(x|ci)p(ci)/p(x)

3)由于P(X)对于所有类为常数，只需要p(X|Ci)最大即可。如果类的先验概率未知，则通常假定这些类是等概率的，即p(c1)=p(c2)=...=p(cm)。并据此只对p(ci|x)最大化。否则，最大化p(x|ci)p(ci).
p(ci)可以用p(ci)=si/s来计算。

5)为对未知样本X分类，对每个类Ci，计算P(X|Ci)p(Ci).样本X被指派到该值最大的类。

二、贝叶斯网络

朴素贝叶斯分类有一个限制条件，就是特征属性必须有条件独立或基本独立（实际上在现实应用中几乎不可能做到完全独立）。当这个条件成立时，朴素贝叶斯分类法的准确率是最高的，但不幸的是，现实中各个特征属性间往往并不条件独立，而是具有较强的相关性，这样就限制了朴素贝叶斯分类的能力。我们可以使用贝叶斯网络（又称贝叶斯信念网络或信念网络）。

1、定义

一个贝叶斯网络定义包括一个有向无环图（DAG）和一个条件概率表集合。DAG中每一个节点表示一个随机变量，可以是可直接观测变量或隐藏变量，而有向边表示随机变量间的条件依赖；条件概率表中的每一个元素对应DAG中唯一的节点，存储此节点对于其所有直接前驱节点的联合条件概率。

贝叶斯网络有一条极为重要的性质，就是我们断言每一个节点在其直接前驱节点的值制定后，这个节点条件独立于其所有非直接前驱前辈节点。

这个性质很类似Markov过程。其实，贝叶斯网络可以看做是Markov链的非线性扩展。这条特性的重要意义在于明确了贝叶斯网络可以方便计算联合概率分布。一般情况先，多变量非独立联合条件概率分布有如下求取公式：

$P(x_1,x_2,...,x_n)=P(x_1)P(x_2|x_1)P(x_3|x_1,x_2)...P(x_n|x_1,x_2,...,x_{n-1})$

而在贝叶斯网络中，由于存在前述性质，任意随机变量组合的联合条件概率分布被化简成

$P(x_1,x_2,...,x_n)=\prod^n_{i=1}P(x_i|Parents(x_i))$

其中Parents表示xi的直接前驱节点的联合，概率值可以从相应条件概率表中查到。

贝叶斯网络比朴素贝叶斯更复杂，而想构造和训练出一个好的贝叶斯网络更是异常艰难。但是贝叶斯网络是模拟人的认知思维推理模式，用一组条件概率函数以及有向无环图对不确定性的因果推理关系建模，因此其具有更高的实用价值。

2、网络构造

构造与训练贝叶斯网络分为以下两步：

1、确定随机变量间的拓扑关系，形成DAG。这一步通常需要领域专家完成，而想要建立一个好的拓扑结构，通常需要不断迭代和改进才可以。

2、训练贝叶斯网络。这一步也就是要完成条件概率表的构造，如果每个随机变量的值都是可以直接观察的，像我们上面的例子，那么这一步的训练是直观的，方法类似于朴素贝叶斯分类。但是通常贝叶斯网络的中存在隐藏变量节点，那么训练方法就是比较复杂，例如使用梯度下降法。由于这些内容过于晦涩以及牵扯到较深入的数学知识，在此不再赘述，有兴趣的朋友可以查阅相关文献。

3、应用

贝叶斯网络作为一种不确定性的因果推理模型，其应用范围非常广，在医疗诊断、信息检索、电子技术与工业工程等诸多方面发挥重要作用，而与其相关的一些问题也是近来的热点研究课题。例如，Google就在诸多服务中使用了贝叶斯网络。

就使用方法来说，贝叶斯网络主要用于概率推理及决策，具体来说，就是在信息不完备的情况下通过可以观察随机变量推断不可观察的随机变量，并且不可观察随机变量可以多于以一个，一般初期将不可观察变量置为随机值，然后进行概率推理。下面举一个例子。

还是SNS社区中不真实账号检测的例子，我们的模型中存在四个随机变量：账号真实性R，头像真实性H，日志密度L，好友密度F。其中H，L，F是可以观察到的值，而我们最关系的R是无法直接观察的。这个问题就划归为通过H，L，F的观察值对R进行概率推理。推理过程可以如下表示：

1、使用观察值实例化H,L和F，把随机值赋给R。

2、计算 $P(R|H,L,F)=P(H|R)P(L|R)P(F|R,H)$ 。其中相应概率值可以查条件概率表。

由于上述例子只有一个未知随机变量，所以不用迭代。更一般得，使用贝叶斯网络进行推理的步骤可如下描述：

1、对所有可观察随机变量节点用观察值实例化；对不可观察节点实例化为随机值。

2、对DAG进行遍历，对每一个不可观察节点y，计算 $P(y|w_i)=\alpha P(y|Parents(y))\prod _jP(s_j|Parents(s_j))$ ，其中wi表示除y以外的其它所有节点，a为正规化因子，sj表示y的第j个子节点。

3、使用第三步计算出的各个y作为未知节点的新值进行实例化，重复第二步，直到结果充分收敛。

4、将收敛结果作为推断值。

以上只是贝叶斯网络推理的算法之一，另外还有其它算法，这里不再详述。

参考： http://www.cnblogs.com/leoo2sk/archive/2010/09/18/bayes-network.html

古韦

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
贝叶斯分类算法

贝叶斯分类是一种统计学分类方法，它利用已知样本的分类统计情况预测未知样本的分类。p(H|X)=p(X|H)p(H)/p(X)朴素贝叶斯分类工作过程：1)每个数据样本用一个n维特征向量X={x1,x2,......xn}表示，分别描述对n个属性A1，A2.....An样本的n个度量。2)假定有m个类C1,C2....Cm。给定一个未知的数据样本X，分类法将预测X属于具有最高后验概
复制链接

扫一扫