决策树简介(七)

1.决策树

决策树(Decision Tree)是类似数据结构中的二叉树,是一种非参数的有监督学习方法,它能够从一系列有特征和标签的数据中总结出决策规则,并用树状图的结构来呈现这些规则,以解决分类和回归问题。
本次主要讲的是决策树的分类问题,我们生活中其实很多场景都用到过决策树的方法。
比如生活中常见的校园招聘过程,对各项条件是否满足进行判断。如下图所示:
在这里插入图片描述
由上图可得到从根节点到叶子节点的过程就是决策的过程,通过各个节点来做出判断并进行分类,由此可知决策树天然解决多分类问题,有非常好的解释性。
决策树主要有两个问题:
每个节点在哪个维度做划分?(类似特征)
某个维度在哪个值上做划分?
由决策树树的两个问题,即通过什么方式或规则来做出判断,因此要讲到信息熵。

2.信息熵

熵在信息论中代表随机变量不确定的度量。
熵越大,数据的不确定性越高;
熵越小,数据的不确定性越低。
香农公式中,信息熵的公式为:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值