前言
决策树(Decision Tree)是一种非参数的有监督学习方法,它能够从一系列有特征和标签的数据中总结出决策规则,并用树状图的结构来呈现这些规则,以解决分类和回归问题。
sklearn中的决策树
1.sklearn.tree模块
sklearn中决策树的类都在tree模块下,模块共包含五个类:
类 | 名称 |
---|---|
tree.DecisionTreeClassififier | 分类树 |
tree.DecisionTreeRegressor | 回归树 |
tree.export_graphviz | 将生成的决策树导出为DOT格式,画图专用 |
tree.ExtraTreeClassififier | 高随机版本的分类树 |
tree.ExtraTreeRegressor | 高随机版本的回归树 |
2.sklearn基本建模流程
在这个流程下,分类树对应的代码是:
from sklearn import tree #导入需要的模块
clf = tree.DecisionTreeClassifier() #实例化
clf = clf.fit(X_train,y_train) #用训练集数据训练模型
result = clf.score(X_test,y_test) #导入测试集,从接口中调用需要的信息