Python数据分析与挖掘实战的决策树纠错

最新推荐文章于 2022-01-20 21:47:07 发布

Drgom

最新推荐文章于 2022-01-20 21:47:07 发布

阅读量159

点赞数

分类专栏：数据挖掘

本文链接：https://blog.csdn.net/qq_43662627/article/details/108767535

版权

数据挖掘专栏收录该内容

18 篇文章 0 订阅

订阅专栏

#导入必要的库
import os
import xlrd
from sklearn.feature_extraction import DictVectorizer
import csv
from sklearn import preprocessing
from sklearn import tree
import pandas as pd
"""""
data[u'销量'][(data[u'销量']=='高')]= "1"
data[u'是否有促销'][(data[u'是否有促销']=='是')]= "1"
data[u'天气'][(data[u'天气']=='好')]= "1"
data[data != "1"] = -1
data = pd.DataFrame(data, dtype="int")
x = data.iloc[:,:3].values
y = data.iloc[:,3].values
"""
lables = []    #用于存储标记实例，也就是本例中的是否购入电脑
feature = []   #用于存储特征
data1 = xlrd.open_workbook(os.path.join('D:/PythonProject/python02/决策树/data', 'sales_data.xls'))
table = data1.sheets()[0]
nrows = table.nrows
for i in range(nrows):
    if i == 0:
        continue
    num = table.row_values(i)

    num= num[4]
    print(num)

    lables.append(num)
    features = {}
    for each in range(1, len(table.row_values(i))- 1):
       features[header[each]] = table.row_values(i)[each]
    feature.append(features)
#print(feature)
#print(lables)
vec = DictVectorizer()
x = vec.fit_transform(feature).toarray()
print('特征提取后的X'+'\n'+str(x))
# print(headers)
lab = preprocessing.LabelBinarizer()
print(lables)
y = lab.fit_transform(lables)
print('Y'+'\n'+str(y))
result = tree.DecisionTreeClassifier(criterion='entropy')
result.fit(x,y)
with open('tree1.dot', 'w') as f:
    f = tree.export_graphviz(result,out_file=f,feature_names=vec.get_feature_names())

安装Graphviz工具可视化决策树
dot -Tpdf tree1.dot -o pic.pdf
在这里插入图片描述
参考链接

https://blog.csdn.net/csqazwsxedc/article/details/65697652
https://blog.csdn.net/weixin_43084928/article/details/82455326

Drgom

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录