算法-决策树(分类算法)

决策树算法(DecisionTree)

决策树是机器学习中常用的分类算法

决策树顾名思义是一种树形结构,而我们的任务就是想办法构建出这样一颗树用它来进行分类。

构建过程:

1. 选择一个对象的特征,并根据这一训练集进行分类

2.计算某特征分类结果的混乱程度

(对于对混乱结果的情况评估,使用了的以下方法)

信息熵:

信息熵就是用来衡量一个随机变量取值的不确定性的一个指标,信息熵越大则不确定性越大,信息熵越小则不确定性也就越小。
信息熵的公式:
信息熵的公式

通常情况下对数以2为底或以e(自然对数)为底,并且我们规定如果pi=0则定义0log0=0。

一个服从两点分布的随机变量的信息熵图像如下图所示:
举例
可以知道,当信息熵趋近于0.5的时候。所得出的信

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值