Abstract
总结scikit-learn中的决策树算法。
前言
决策树将分类和回归问题归结为做出一系列子决策,通过从数据特性中推导出简单的决策规则来创建决策模型。
决策树模型有:ID3、ID4、ID5、C4.5、CART(Classification and Regression Tree)。
决策树算法
scikit-learn中决策树算法采用的是CART。
当使用 CART解决分类问题时,会使用待预测样本所在的叶子节点所有的数据进行投票,来决定未知样本的类别;当使用 CART解决回归问题时,会使用待预测样本所在的叶子节点所有的样本输出的平均值,来表示未知样本的输出值。
1. 分类问题-DecisionTreeClassifier
2. 回归问题-DecisionTreeRegressor
备注
决策树原理可参考的资料:
- 决策树算法原理(上)
http://www.cnblogs.com/pinard/p/6050306.html- 决策树算法原理(下)
http://www.cnblogs.com/pinard/p/6053344.html
scikit-learn中决策树调参注意事项:
- scikit-learn决策树算法类库使用小结
https://www.cnblogs.com/pinard/p/6056319.html