决策树_clf = tree.decisiontreeclassifier() 参数-CSDN博客

本文链接：https://blog.csdn.net/finance_python/article/details/112359847

本文介绍了决策树在sklearn中的应用，包括数据集导入、数据划分、初步建模，重点讨论了决策树的参数如criterion、random_state、splitter、max_depth等的调优，并分析了其对模型拟合程度的影响。通过学习曲线，探讨了如何找到最优的剪枝参数以避免过拟合。

摘要由CSDN通过智能技术生成

决策树常用参数调优

sklearn-决策树

简介
决策树，直白的理解可以看成是if-else进行分类，满足某个特征就会进入下一个枝节点；通过历史数据进行分析，寻找数据中的重要的特征。并以此为依据对新传入的数据进行特征分类，进行预测。

Read more: http://bluewhale.cc/2016-03-20/decision-tree.html#ixzz6j146FjPI
sklearn基本建模流程
1、实例化，建立评估模型对象—>2、通过模型接口训练模型—>3、通过模型接口提取需要的信息
在这里插入图片描述

决策树一种非参数的有监督学习方法，能从一系列有特征和标签的数据中总结出决策规则，并用树状图的结构来呈现这些规则，以解决分类和回归问题。

1、数据集导入

#导包
from sklearn import tree
from sklearn.datasets import load_wine
from sklearn.model_selection import train_test_split
#使用红酒数据集
wine = load_wine()
wine

在这里插入图片描述
可见数据集里面的数据多且杂乱无序，下一步将数据写入到DataFrame中

#红酒数据集形状
wine.data.shape

在这里插入图片描述

#红酒数据集标签
wine.target

在这里插入图片描述

import pandas as pd
pd.concat([pd.DataFrame(wine.data),pd.DataFrame(wine.target)],axis=1)

在这里插入图片描述

2、查看数据信息

#红酒数据集特征名称
wine.feature_names

在这里插入图片描述

#红酒数据集标签名称
wine.target_names