学习python：决策树算法

最新推荐文章于 2024-07-11 09:58:56 发布

i春暖花开

最新推荐文章于 2024-07-11 09:58:56 发布

阅读量702

点赞数 1

分类专栏：机器学习文章标签： python 算法

本文链接：https://blog.csdn.net/lanyanchenxi/article/details/78002333

版权

本文介绍了决策树的简单算法思想，强调了属性选择在构造决策树中的重要性，特别是ID3和C4.5属性选择度量。通过分裂属性，寻找最佳分类标准，以达到子集尽可能纯净的目标。同时提到了连续属性的处理方式和熵在信息增益中的作用。

摘要由CSDN通过智能技术生成

决策树简单算法思想：

构造决策树，它主要是属性的选择，来选择将元组最好的划分成不同的类的属性。

关键：

在于分裂属性。所谓分列属性就是在某个节点处按照某一个特征属性的不同划分构造不同的分支，其目标是让各个分裂子集尽可能的“纯”。尽可能的纯意味着尽量让一个分裂子集中待分类项属于同一类别。
分列属性有三种不同情形：
1：属性离散，且不要求生成二叉决策树。此时属性的每一个划分作为一个分支。
2：属性离散，要求生成二叉决策树。此时，属于此子集，不属于此子集作为一个划分。
3：属性是连续的，此时确定一个值作为分类点。大于此值，作为一个分支；小于此值，作为一个分支。

属性选择度量：ID3，C4.5

说明：熵越大，表明信息越混乱。所以用信息增益时，选择，信息增益值越大，表明混乱程度减少越大，分类越纯，特征越有益于分类。

这里写图片描述

@机器学习实战
from math import log

def createDataSet():
    dataSet=[[1,1,'maybe'],[1,1,'yes'],[1,0,'no'],[0,1,'no'],[0,

最低0.47元/天解锁文章

i春暖花开

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录