决策树
决策树(Decision Tree)
决策树是一个预测模型,是一种非参数的监督学习方法,使用树状图来呈现它从数据特征和标签中总结出的规则。
类名 | 功能 |
---|---|
tree.DecisionTreeClasifier | 分类树 |
tree.DecisionTreeRegressor | 回归树 |
tree.export_graphviz | 画出生成的决策树 |
建模基本流程
- 实例化模型对象
- 划分训练集和测试集,训练模型
- 获取模型参数,调参
相关库
Python
Scikit-learn
Graphviz
Pandas
Matplotlib
SciPy
Numpy
分类树(DecisionTreeClassifier)
分类树重要参数
criterion(决定不纯度的计算方法,帮助寻找最佳节点和分支,不纯度越低越好):
- “entropy”:使用信息熵(当决策树的拟合程度不够的时候使用)
- “gini”:基尼系数(默认)数据维度很大,噪音很大时使用