机器学习算法(二)——决策树分类算法及R语言实现方法

决策树算法是分类算法中最常用的算法之一。决策树是一种类似流程图的树形结构,可以处理高维数据,直观易理解,且准确率较高,因此应用广泛。本篇小博就决策树的若干算法:ID3算法、C4.5算法以及分类回归树(CART)、C5.0进行对比介绍,并对比C4.5与C5.0处理较大数据集时的效率,观察C5.0效率提升了多少。

一、概况

算法名称 分类属性选取标准 标准描述 优点 缺点
ID3 信息增益 该分类属性带来的熵的变化 。。 ① 只能描述属性为离散型的变量;②偏向具有许多输出的测试,即总是倾向于选择包含多取值的参数,因为参数的取值越多,其分割后的子节点纯度可能越高。采用极限思维,若分类属性
  • 0
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值