决策树-信息熵、ID3、C4.5算法介绍

本文深入探讨了决策树算法,特别是ID3和C4.5算法。ID3算法利用信息增益选择最佳特征进行节点划分,而C4.5则解决了连续变量处理的问题。信息增益是衡量得知特征信息后减少类不确定性的一个关键指标。在数据挖掘中,决策树因其易于理解和解释而被广泛应用。
摘要由CSDN通过智能技术生成

决策树
在这里插入图片描述
例子
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
ID3算法

信息增益:表示得知特征X的信息而使得类Y的信息的不确定性减少的程度
在这里插入图片描述
选择根节点(数字最大的那个,这里是age)
在这里插入图片描述
在这里插入图片描述
连续变量处理

可以对数据进行分割,然后计算分割点信息增益

C4.5算法
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值