机器学习(9)决策树

决策树仍然是监督学习方法,其基本思路跟我们人做一些决策的思路类似:可能要下雨,那就带伞;可能要停水,那就提前备水……

这个决策的数学模型是熵。

熵是信息学概念,表示的是信息量的大小,越不可能发生的事情,它的信息量就越大;越是可能发生板上钉钉的事情,它的信息量就越小。

有一个有名的理论叫熵增,它说的是万事万物在不加干扰的情况下,都在向混乱和无序发展:不加节制只会越来越肥;放在桌子上的苹果总会腐烂掉;热量总会流失;……

熵增它描述了宇宙和人类的终极命运。

决策树的模型中,无论是ID3,还是C4.5,亦或者是CART,它们在每个节点做判据的目标都是为了让熵最小化!

核心的内容已经说完了,具体的内容参见如下的推导,一些数学公式的细节可以自行网查。

相关数学概念准备:

决策树的算法推导流程如下:

如下示例的题材,最后一列是结果,其他列是输入。

ID3的手推示例如下所示:

CART的手推示例如下所示:

(如果对你有启发,请【在看】支持,谢谢!)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值