二、分类决策树与条件概率分布
分类决策树可以认为是定义在特征空间与类空间上的条件概率分布。分类决策树将特征空间划分为互不相交的区域,并在每
一个区域上定义一个类的概率分布。树上的一条路径对应于划分中的一个区域。假设X为表示特征的随机变量,Y表示类的随
机变量,那么这个条件变量可以表示为P(Y|X)。X取值于给定划分下区域的集合,Y取值于类的集合。各叶结点上的条件概率
通常偏向一个概率较大的类,即属于某一类的概率较大,决策树分类时将该结点的实例分到该类。
分类决策树可以认为是定义在特征空间与类空间上的条件概率分布。分类决策树将特征空间划分为互不相交的区域,并在每
一个区域上定义一个类的概率分布。树上的一条路径对应于划分中的一个区域。假设X为表示特征的随机变量,Y表示类的随
机变量,那么这个条件变量可以表示为P(Y|X)。X取值于给定划分下区域的集合,Y取值于类的集合。各叶结点上的条件概率
通常偏向一个概率较大的类,即属于某一类的概率较大,决策树分类时将该结点的实例分到该类。