【自用】菜菜sklearn 第一期决策树概述 & 分类树

Lennng

于 2023-02-22 10:01:53 发布

阅读量195

点赞数

分类专栏： sklearn 文章标签： sklearn 机器学习 python

本文链接：https://blog.csdn.net/weixin_44845052/article/details/129137319

版权

决策树

1.1 概述

1 Decision Tree 非参数的有监督学习方法；树状图；解决分类和回归问题；

根节点；中间节点；叶节点；子节点和父节点

2 决策树算法的核心是要解决两个问题：

1）如何从数据表中找出最佳节点和最佳分支

2）如何让决策树停止生长，防止过拟合

1.2 sklearn中的决策树

tree.DecisionTreeClassifier	分类树
tree.DecisionTreeRegressor	回归树
tree.export_graphviz	将生成的决策树导出为DOT格式，画图专用
tree.ExtraTreeClassifier	高随机版本的分类树
tree.ExtraTreeRegressor	高随机版本的回归树

# sklearn的基本建模流程

在这个流程下，分类树对应的代码：

# 导入需要的模块
from sklearn import tree

# 实例化
clf = tree.DecisionTreeClassifier()
# 用训练集数据训练模型
clf = clf.fit(x_train, y_train)
# 导入测试集，从接口中调用需要的信息
result = clf.score(x_test, y_test)

2 DecisionTreeClassifier与红酒数据集

class sklearn.tree.DecisionTreeClassifier(criterion='gini', )