朴素贝叶斯的“属性条件独立性假设"在现实生活中往往很难成立。由此有了半朴素贝叶斯分类器,适当考虑一部分属性之间的相互依赖关系。"独依赖估计" (One-Dependent Estimator ,简称 ODE)是半朴素贝叶斯分类器最常用的一种策略。"独依赖"就是假设每个属性在类别之外最多仅依赖于一个其他属性,即
问题转化为确定每个属性的父属性。
假设有一个“超父”属性,是所有属性的父属性。图b中X1是超父属性。这个叫做SPODE (Super-Parent ODE)方法。
TAN算法类似于最大带权生成树,将属性作为节点构建树,节点之间的连线表示两者之间的关系。