from math import log
#计算给定的熵
def calcsahnnonent(dataset):
numentries = len(dataset) #计算实例的总数
labelcounts ={}
#创建一个数据字典
for featvec in dataset:
currentlabel = featvec[-1] #键值是最后一列数值
if currentlabel not in labelcounts.keys(): #为所有可能的分类创建字典。使用的是字典中key()方法
labelcounts[currentlabel]= 0
labelcounts[currentlab
机器学习实战决策树(一)——信息增益与划分数据集
最新推荐文章于 2021-11-17 20:29:28 发布