实验4 决策树分类实验中

最新推荐文章于 2022-12-07 16:53:32 发布

ustcthebest

最新推荐文章于 2022-12-07 16:53:32 发布

阅读量486

点赞数 1

文章标签：决策树算法概率论

本文链接：https://blog.csdn.net/vimpirespider/article/details/120552669

版权

一、实验要求

在计算机上验证和测试招聘数据的决策树分类实验，理解基尼系数生成决策树，同时理解决策树的参数。

实验目的

1、掌握决策树分类的原理

2、能够实现决策树分类算法；

3、掌握决策树的参数设置；

三、实验内容

实验步骤

请阅读DecisionTree1代码，实现基尼系数生成决策树的，gini函数。

请阅读DecisionTree2代码，实现calOneEntropy和calOneGini函数，选取莺尾花数据的某个特征，对其分割，针对每个分割点分别计算信息熵和基尼系数，最后把信息熵和基尼系数的曲线图画出来。

def calOneEntropy(X,y,n=100):
    ents = np.zeros(n)
    X1 = X[:,3]
    cuts = np.linspace(X1.min(),X1.max(),n)
    #开始计算
    i = 0
    for num in cuts:
        ent = 0.0
        y1 = y[X1 < num]
        y2 = y[X1 > num]
        ent += entropy(y1)
        ent += entropy(y2)
        ents[i] = ent
        i+=1
    return cuts,ents

cuts,ents = calOneEntropy(X,y)
plt.xlabel('cuts')
plt.ylabel('ents')
plt.plot(cuts,ents)
plt.show()

def calOneGini(X,y,n=100):
    ents = np.zeros(n)
    X1 = X[:,3]
    cuts = np.linspace(X1.min(),X1.max(),n)
    #开始计算
    i = 0
    for num in cuts:
        ent = 0.0
        ent += gini(y[X1 < num])
        ent += gini(y[X1 > num])
        ents[i] = ent
        i+=1
    return cuts,ents

cuts,ents = calOneGini(X,y)
plt.xlabel('cuts')
plt.ylabel('ents')
plt.plot(cuts,ents)
plt.show()