决策树入门,小白也能轻松掌握!!!!

目录

一、观察表格,导入库

二、按照9:1划分数据集和训练集

三、构建模型训练模型进行评估

四、使用混淆矩阵对模型进行评估

五、构建决策树并可视化

六、预测



一、观察表格,导入库

import pandas as pd
from sklearn import tree
from sklearn.metrics import confusion_matrix
import matplotlib.pyplot as plt
data=pd.read_excel('文件名字.xlsx')
data.head()

 二、按照9:1划分数据集和训练集

from sklearn.model_selection import train_test_split
feature_vector=data.iloc[:,1:13]
objcet_variable=data['购买意愿']
x_train,x_test,y_train,y_test=train_test_split(feature_vector,objcet_variable,test_size=0.1,random_state=3)

三、构建模型训练模型进行评估

clf=tree.DecisionTreeClassifier(criterion='entropy',max_depth=7,random_state=3)
clf=clf.fit(x_train,y_train)
clf.score(x_test,y_test)

结果为0.875

四、使用混淆矩阵对模型进行评估

import warnings
from sklearn.metrics import ConfusionMatrixDisplay
warnings.filterwarnings('ignore')
y_pred=clf.predict(x_test)
cm=confusion_matrix(y_test,y_pred)
ConfusionMatrixDisplay(confusion_matrix=cm).plot()

 该模型可以作为决策的依据

五、构建决策树并可视化

import matplotlib
y_pred=clf.predict(x_test)
confusion_matrix(y_test,y_pred)
name=data.columns
feature_names=name.tolist()
class_names=['愿意','不愿意']
plt.figure(dpi=80,figsize=(25,9))
matplotlib.rcParams['font.sans-serif'] = ['SimHei']     # 显示中文
matplotlib.rcParams['axes.unicode_minus'] = False
tree.plot_tree(clf,feature_names=feature_names,class_names=class_names,impurity=False,fontsize=10)

 六、预测

forecast=pd.read_excel('文件名字.xlsx',sheet_name='预测客户数据')
clf.predict(forecast.iloc[:,1:])
 结果:  array([0, 0, 1, 0, 0], dtype=int64)

--------------------------------------------------------------------------------------------------------------------------------

兄弟们,写题不易,记得点赞关注!!!!!

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值