一、决策树是怎样工作的
重要参数都有哪些?
二、下面就开始建立一棵树了,具体步骤如下所示:
(1)首先导入需要的模块以及相关的库
from sklearn import tree
from sklearn.datasets import load_wine
from sklearn.model_selection import train_test_split
(2)导入数据集
wine=load_wine()
wine.target
这个数据比较特别,我们可以先把它进行整合成Dataframe的形式
import pandas as pd
pd.concat([pd.DataFrame(wine.data),pd.DataFrame(wine.target)],axis=1)[:5]
#将数据进行dataframe 展示
结果如下:
0 1 2 3 4 5 6 7 8 9 10 11 12 0
0 14.23 1.71 2.43 15.6 127.0 2.80 3.06 0.28 2.29 5.64 1.04 3.92 1065.0 0
1 13.20 1.78 2.14 11.2 100.0 2.65 2.76 0.26 1.28 4.38 1.05 3.40 1050.0 0
2 13.16 2.36 2.67 18.6 101.0 2.80 3.24 0.30 2.81 5.68 1.03 3.17 1185.0 0
3 14.37 1.95 2.50 16.8 113.0 3.85 3.49 0.24 2.18 7.80 0.86 3.45 1480.0 0
4 13.24 2.59 2.87 21.0 118.0 2.80 2.69 0.39 1.82 4.32 1.04 2.93 735.0 0
展示特征名称
wine.feature_names#展示数据的特征名
结果:
['alcohol',
'malic_acid',
'ash',
'a