数据科学—决策树分类器(企业客户分类问题)

问题描述

  • 某企业现需要将自己的客户分为两类,分别记为
    第0类和第1类。为进行分类,企业对客户的特征进行了量化,
    针对每个客户建立特征向量,该向量包含两个元素。企业对
    历史资料进行分析,建立了训练集。

目标

  • 给定一个顾客及其特征向量,得到该顾客所属类别

数据集

  • 训练集 data0.txt 包含了第0类顾客及其特征向量
    data1.txt 包含了第1类顾客及其特征向量
  • 目标集 objdata.txt 包含需要分类的目标顾客

算法阐述

  • 导入训练集数据,将训练集中两类数据进行合并(使用numpy库中的concatenate()方法对多维数组进行合并),其次时建立决策树分类器,使用决策树分类器中的fit()方法进行训练集的训练,分类。再次使用predict()函数进行目标集的预测。

代码

from sklearn.datasets import make_blobs
from sklearn import tree
import numpy as np
from matplotlib import pyplot as plt
import os

x = np.loadtxt('data0.txt')#class 0 100个数据
y = np.loadtxt('data1.txt')#class 1 100个数据
#或使用ones()函数和zeros()函数,生成0,1标签
z1=[0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0]
z2=[1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1]
os.system("python loaddatafun.py") #调用显示另一个程序文件运行

targetdataset = np.loadtxt('objdata.txt')#目标集
grid=np.concatenate([x,y]) #训练集数据拼接
print(grid)
b=z1+z2 #标签的拼接


clf = tree.DecisionTreeClassifier() #建立决策树分类器
clf = clf.fit(grid,b) #训练训练集
result = clf.predict(targetdataset) #预测目标值
print(result)
#os.system("python loadtargetdatafun.py") #调用显示另一个程序文件运行
#结果可视化
k=1
z=0
for i in result:
    if i==0:
        plt.scatter(targetdataset[z:k,0],targetdataset[z:k,1],c='r')
    else:
        plt.scatter(targetdataset[z:k,0],targetdataset[z:k,1],c='g')
    z=z+1
    k=k+1
plt.show()

结果

训练集

在这里插入图片描述

目标集分类

在这里插入图片描述

在这里插入图片描述

  • 3
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值