学习python:决策树算法

本文介绍了决策树的简单算法思想,强调了属性选择在构造决策树中的重要性,特别是ID3和C4.5属性选择度量。通过分裂属性,寻找最佳分类标准,以达到子集尽可能纯净的目标。同时提到了连续属性的处理方式和熵在信息增益中的作用。
摘要由CSDN通过智能技术生成

决策树简单算法思想:

构造决策树,它主要是属性的选择,来选择将元组最好的划分成不同的类的属性。

关键:

在于分裂属性。所谓分列属性就是在某个节点处按照某一个特征属性的不同划分构造不同的分支,其目标是让各个分裂子集尽可能的“纯”。尽可能的纯意味着尽量让一个分裂子集中待分类项属于同一类别。
分列属性有三种不同情形:
1:属性离散,且不要求生成二叉决策树。此时属性的每一个划分作为一个分支。
2:属性离散,要求生成二叉决策树。此时,属于此子集,不属于此子集作为一个划分。
3:属性是连续的,此时确定一个值作为分类点。大于此值,作为一个分支;小于此值,作为一个分支。

属性选择度量:ID3,C4.5

说明:熵越大,表明信息越混乱。所以用信息增益时,选择,信息增益值越大,表明混乱程度减少越大,分类越纯,特征越有益于分类。

这里写图片描述

@机器学习实战
from math import log

def createDataSet():
    dataSet=[[1,1,'maybe'],[1,1,'yes'],[1,0,'no'],[0,1,'no'],[0,
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值