决策树算法梳理

决策树算法梳理

1.信息论基础
:熵是表示随机变量不确定性的度量
(解释:说白了就是事物内部的混乱程度,比如杂货市场里面什么都有那肯定混乱,专卖店里面只卖一个牌子的那就稳定多了)
公式:

在这里插入图片描述
在这里插入图片描述
联合熵
联合熵就是度量一个联合分布的随机系统的不确定度。
条件熵
条件熵H(Y|X)表示在已知随机变量X的条件下随机变量Y的不确定性。
信息增益
表示特征X使得类Y的不确定性减少的程度。(分类后的专一性,希望分类后的结果是同类在一起)
在这里插入图片描述
其中 I 为不纯度的度量,关于 N 的计算是划分后的个数加权。
I 为熵(Entropy)的时候,Delta 为信息增益。
基尼不存度
基尼不存度是指来自集合的某种结果随机应用于集合中某一数据的预期误差。(如果集合中所有结果属于同一类,则误差为0࿰

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值