常见数据类型 连续型特征 /二分类特征/分级特征(rank data)/多分类特征 常见术语 根节点(只有箭头指出) 内节点(有箭头指出和指入) 叶子节点(只有箭头指入) 如何确定一棵决策树? 通过Gini系数,越小的越好 以以下的数据为例进行讲解 对每个特征做以下统计 最终得到 那么Gini系数则可以这样计算