classification and regression trees 简称分类回归树,可以用来处理分类或者回归问题。
分类树的节点split依据选择gini系数最小的分裂点,gini系数越小不确定性越小。
回归树的节点分类采用最小方差作为分裂点的依据。
对特征A,计算所有属性值的切分结果S1和S2数据集的方差,计算S1和S2的方差之和,取最小的为分裂点和分裂特征index为此次最优切分方案。
中间可以设定剪枝方案。
classification and regression trees 简称分类回归树,可以用来处理分类或者回归问题。
分类树的节点split依据选择gini系数最小的分裂点,gini系数越小不确定性越小。
回归树的节点分类采用最小方差作为分裂点的依据。
对特征A,计算所有属性值的切分结果S1和S2数据集的方差,计算S1和S2的方差之和,取最小的为分裂点和分裂特征index为此次最优切分方案。
中间可以设定剪枝方案。