前两篇决策树的blog介绍了有关决策树的理论知识,这篇文章我们编码实践一下,采用了网上较为简单的一个有关天气影响运动的数据集,决策树建模部分是利用sklearn.tree.DecisionTreeClassifier()训练构建决策树模型,利用pydotplus+graphviz进行模型可视化展示。
数据集
由于数据量较少,就不再划分训练集测试集,将以上数据全部用于训练。
编码
import pandas as pd
from pandas import Series
import pydotplus
from sklearn import tree
from sklearn.externals.six import StringIO
# load data
datadic = '决策树.xlsx'
mydata = pd.read_excel(datadic)
# prepare
whetherlist = []
windlist =[]
resultlist = []
for i in range(len(mydata)):
if mydata.ix[i][u'天气'] == u'晴':
whetherlist.append(0)
elif mydata.ix[i][u'天