决策树算法 decision tree algorithm(ID3 and CART)

  1. 决策树是一种基本的分类与回归方法,从分类来说,svm也用于分类,我们为什么要用决策树呢?
    a. 决策树一般是模拟人类的行为,数据和算法更便于理解
    b. 决策树不是黑盒,能让你看清他是怎么工作和解释数据的

下面是关于是否提供贷款给个人的一个决策树,简单明了

在这里插入图片描述
为了得到这课决策树,我们的训练数据类似下面的表格,只列了一点,需要更多数据完成训练:
在这里插入图片描述

现在的关键问题在于如何选取每一层的节点,原则在于尽量分得更明确,也就是减少信息的混乱程度。关于信息的混乱程度,信息学里叫做熵(Entropy),下面形象的说一下

  1. 熵、信息增益和基尼系数
    2.1 所谓熵也就是信息的不确定性,也就是混乱程度,举个例子便于理解。
    我们玩一个大转盘,有32个格子,分别标了1-32的数字,格子大小都一样,那么转动以后每个格子被指针指到的概率也是一样的。那么在转盘转动之前我们要下注的话就很纠结了,随便下哪一个都一样。这时候整个系统的信息是非常混乱无序的。
  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值