贝叶斯方法是一种研究不确定性的推理方法。不确定性常用贝叶斯概率表示,它是一种主观概率。
贝叶斯公式:
贝叶斯信念网络:简称贝叶斯网络,用图形表示一组随机变量之间的概率关系。有以下两个主要成分:
(1)一个有向无环图,表示变量之间的依赖关系;
(2)一个概率表,把各节点和它的直接父节点关联起来
贝叶斯网络的重要性质:
贝叶斯网络中的一个节点,如果它的父母节点已知,则它条件独立于它所有的非后代节点。
贝叶斯网络建模的两个步骤:
(1)创建网络结构以及估计每一个节点的概率表中的概率值。
(2)网络拓扑结构可以通过对主观的领域专家知识编码获得。
贝叶斯分类器的计算模型为:
由朴素贝叶斯分类器的属性独立性假设,假设各属性(i=1,2,3,…,n)间相互类条件独立,则,
于是被修改为:
朴素贝叶斯分类模型算法描述如下:
(1)对训练样本数据集和测试样本数据集进行离散化处理和缺失值处理;
(2)扫描训练样本数据集,分别统计训练集中类别的个数和属于类别的样本中属性取值为的实例样本个数,构成统计表;
(3)计算先验概率和条件概率,构成概率表;
(4)构建分类模型
(5)扫描分类模型的样本数据集,调用已得到的统计表、概率表以及构建好的分类准则,得出分类结果
朴素贝叶斯模型的不足:
对属性之间的独立性要求太严格