机器学习-决策树（求字典树）

Vivinia_Vivinia

于 2019-07-16 14:53:06 发布

阅读量416

点赞数

分类专栏：机器学习文章标签： python 机器学习决策树字典树

本文链接：https://blog.csdn.net/hester_hester/article/details/96135794

版权

本文详细探讨了机器学习中的决策树算法，分为三个步骤进行解析，目前是第二部分，主要关注决策树的构建过程。后续内容将介绍如何用图形化方式展示决策树。

摘要由CSDN通过智能技术生成

感觉不太好理解，所以把决策树的创建分了三个部分，这是第二个部分，后一篇会写具体绘制树形图

from math import log
import operator

"""计算香农熵"""
def calcShannonEnt(dataSet):
    numEntries = len(dataSet)
    labelCounts = {}
    for featVec in dataSet:  # 遍历每一行数据
        currentLabel = featVec[-1]  # 取最后一列
        if currentLabel not in labelCounts.keys():  # 该可能标签情况是否存在字典中
            labelCounts[currentLabel] = 0  # 不存在就创建一个
        labelCounts[currentLabel] += 1
    shannonEnt = 0.0
    for key in labelCounts:  # 遍历每种可能标签
        prob = float(labelCounts[key]) / numEntries  # 每种的概率
        shannonEnt -= prob * log(prob, 2)  # 香农熵计算公式
    return shannonEnt


"""去掉某特征对应的数据列"""
def splitDataSet(dataSet, axis, value):  # 参数为全部数据，想要操作的列，想要删除的值（将所有数据中中，取该列为这个值得行，并且去掉该列）
    retDataSet = []
    for featVec in dataSet:  # 遍历每一行
        i

最低0.47元/天解锁文章

Vivinia_Vivinia

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习-决策树（求字典树）

感觉不太好理解，所以把决策树的创建分了三个部分，这是第二个部分，后一篇会写具体绘制树形图from math import logimport operator"""计算香农熵"""def calcShannonEnt(dataSet): numEntries = len(dataSet) labelCounts = {} for featVec in data...
复制链接

扫一扫

专栏目录