现实情况是属性全部独立基本上是不可能的,而如果完全考虑各属性之间的相关性会大大增加计算复杂度,所以才引入半朴素贝叶斯网络:进一步放松条件独立性假设,即假设部分属性之间存在依赖关系。
独依赖估计:每个其他属性最多只依赖于一个属性,即:
对于父属性已知的计算,可采用式(9)的计算方式进行计算。故问题就在如何确定父属性,最简单的方法是如图(b)所示,SPODE,称为超父属性,即所有节点都依赖于同一个父属性,x1为超父属性。
TAN树则是在最大带权生成树算法的基础上,通过一下步骤获得(c)的树形结构:
(1) 计算任意两个属性之间的条件互信息
(2) 以属性为节点构造完全图,两节点之间的权值为互信息
贝叶斯系列:(二)半朴素贝叶斯分类器
本文介绍了半朴素贝叶斯分类器的背景和应用,包括独依赖估计(IDE)、SPODE和TAN树等模型。通过条件互信息衡量属性间的依赖,以降低计算复杂度并提升分类性能。AODE作为一种集成学习方法,通过构建多个SPODE并集成,提供更准确的分类结果。
摘要由CSDN通过智能技术生成