机器学习实战决策树（一）——信息增益与划分数据集

最新推荐文章于 2021-11-17 20:29:28 发布

搞数据的统计女孩

最新推荐文章于 2021-11-17 20:29:28 发布

阅读量1k

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/Tracy1226/article/details/83449082

版权

from math import log
#计算给定的熵
def calcsahnnonent(dataset):
        numentries = len(dataset)     #计算实例的总数
        labelcounts ={}
        #创建一个数据字典
        for featvec in dataset:
            currentlabel = featvec[-1]    #键值是最后一列数值                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                       
            if currentlabel not in labelcounts.keys():  #为所有可能的分类创建字典。使用的是字典中key（）方法
                labelcounts[currentlabel]= 0
            labelcounts[currentlab