决策树常用参数调优
sklearn-决策树
简介
决策树,直白的理解可以看成是if-else进行分类,满足某个特征就会进入下一个枝节点;通过历史数据进行分析,寻找数据中的重要的特征。并以此为依据对新传入的数据进行特征分类,进行预测。
Read more: http://bluewhale.cc/2016-03-20/decision-tree.html#ixzz6j146FjPI
sklearn基本建模流程
1、实例化,建立评估模型对象—>2、通过模型接口训练模型—>3、通过模型接口提取需要的信息
决策树一种非参数的有监督学习方法,能从一系列有特征和标签的数据中总结出决策规则,并用树状图的结构来呈现这些规则,以解决分类和回归问题。
1、数据集导入
#导包
from sklearn import tree
from sklearn.datasets import load_wine
from sklearn.model_selection import train_test_split
#使用红酒数据集
wine = load_wine()
wine
可见数据集里面的数据多且杂乱无序,下一步将数据写入到DataFrame中
#红酒数据集形状
wine.data.shape
#红酒数据集标签
wine.target
import pandas as pd
pd.concat([pd.DataFrame(wine.data),pd.DataFrame(wine.target)],axis=1)
2、查看数据信息
#红酒数据集特征名称
wine.feature_names