《机器学习实战》——决策树的构造及案例

最新推荐文章于 2024-03-31 21:32:48 发布

哆啦AA梦

最新推荐文章于 2024-03-31 21:32:48 发布

阅读量1k

点赞数

分类专栏： python 机器学习文章标签： python 算法机器学习

本文链接：https://blog.csdn.net/y1535766478/article/details/76554694

版权

本文详细介绍了如何通过ID3算法构建决策树，包括信息增益的概念，如何划分数据集，以及递归构建决策树的过程。通过Python实现，展示了决策树在预测隐形眼镜类型的实例，解释了算法的执行分类和存储方法。

摘要由CSDN通过智能技术生成

ID3算法的决策树的构造

决策树的理论部分，不再赘述，本篇博文主要是自己的学习笔记（《机器学习实战》）

先看下述决策树，希望对理解决策树有一定的帮助。

3.1.1信息增益

首先需要了解两个公式：

创建名为treesde.py文件，将下述代码添加进去

from math import log

def calcShannonEnt(dataSet):#该函数的功能是计算给定数据集的香农熵
    numEntries=len(dataSet)
    labelCounts={}
    for featVec in dataSet:
        currentLabel=featVec[-1]
        if currentLabel not in labelCounts.keys():
            labelCounts[currentLabel]=0
        labelCounts[currentLabel]+=1
    shannonEnt=0.0
    for key in labelCounts:
        prob =float(labelCounts[key])/numEntries
        shannonEnt-=prob*log(prob,2)
    return shannonEnt

输入数据集

def createDataSet():
    dataSet=[[1,1,'yes'],
             [1, 1, 'yes'],
             [1,0,'no'],
             [0, 1, 'no'],
             [0, 1, 'no'],
             ]
    labels=['no suffacing','flippers']
    return dataSet,labels

在python命令提示符下输入下述命令：

得到的0.970~~~~就是商，熵越高则说明混合的数据越多。

最低0.47元/天解锁文章

哆啦AA梦

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
《机器学习实战》——决策树的构造及案例

ID3算法的决策树的构造决策树的理论部分，不再赘述，本篇博文主要是自己的学习笔记（《机器学习实战》）先看下述决策树，希望对理解决策树有一定的帮助。3.1.1信息增益首先需要了解两个公式：创建名为treesde.py文件，将下述代码添加进去from math import logdef calcShannonEnt(dataSet):#该函数的
复制链接

扫一扫

专栏目录