数据科学—决策树分类器（企业客户分类问题）

最新推荐文章于 2024-01-17 18:56:16 发布

little Y

最新推荐文章于 2024-01-17 18:56:16 发布

阅读量705

点赞数 3

分类专栏： Python

本文链接：https://blog.csdn.net/xuezhe_____/article/details/112865834

版权

Python 专栏收录该内容

16 篇文章 0 订阅

订阅专栏

企业客户分类问题-决策树分类器

问题描述
目标
数据集
算法阐述
代码
结果
- 训练集
- 目标集分类

问题描述

某企业现需要将自己的客户分为两类，分别记为
第0类和第1类。为进行分类，企业对客户的特征进行了量化，
针对每个客户建立特征向量，该向量包含两个元素。企业对
历史资料进行分析，建立了训练集。

目标

给定一个顾客及其特征向量，得到该顾客所属类别

数据集

训练集 data0.txt 包含了第0类顾客及其特征向量
data1.txt 包含了第1类顾客及其特征向量
目标集 objdata.txt 包含需要分类的目标顾客

算法阐述

导入训练集数据，将训练集中两类数据进行合并（使用numpy库中的concatenate()方法对多维数组进行合并），其次时建立决策树分类器，使用决策树分类器中的fit()方法进行训练集的训练，分类。再次使用predict（）函数进行目标集的预测。

代码

from sklearn.datasets import make_blobs
from sklearn import tree
import numpy as np
from matplotlib import pyplot as plt
import os

x = np.loadtxt('data0.txt')#class 0 100个数据
y = np.loadtxt('data1.txt')#class 1 100个数据
#或使用ones()函数和zeros()函数，生成0,1标签
z1=[0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0]
z2=[1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1]
os.system("python loaddatafun.py") #调用显示另一个程序文件运行

targetdataset = np.loadtxt('objdata.txt')#目标集
grid=np.concatenate([x,y]) #训练集数据拼接
print(grid)
b=z1+z2 #标签的拼接


clf = tree.DecisionTreeClassifier() #建立决策树分类器
clf = clf.fit(grid,b) #训练训练集
result = clf.predict(targetdataset) #预测目标值
print(result)
#os.system("python loadtargetdatafun.py") #调用显示另一个程序文件运行
#结果可视化
k=1
z=0
for i in result:
    if i==0:
        plt.scatter(targetdataset[z:k,0],targetdataset[z:k,1],c='r')
    else:
        plt.scatter(targetdataset[z:k,0],targetdataset[z:k,1],c='g')
    z=z+1
    k=k+1
plt.show()

结果

训练集

在这里插入图片描述

目标集分类

在这里插入图片描述

little Y

关注

3
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
数据科学—决策树分类器（企业客户分类问题）

企业客户分类问题-决策树分类器问题描述目标数据集算法阐述代码结果训练集目标集分类问题描述某企业现需要将自己的客户分为两类，分别记为第0类和第1类。为进行分类，企业对客户的特征进行了量化，针对每个客户建立特征向量，该向量包含两个元素。企业对历史资料进行分析，建立了训练集。目标给定一个顾客及其特征向量，得到该顾客所属类别数据集训练集 data0.txt 包含了第0类顾客及其特征向量data1.txt 包含了第1类顾客及其特征向量目标集 objdata.txt 包含需要分类的目标顾
复制链接

扫一扫