机器学习——决策树和随机森林(update)

本文深入探讨了机器学习中的决策树,包括信息熵、信息增益、决策树的构建与评价,以及剪枝策略。此外,还介绍了随机森林的概念,它是通过集成学习方法构建多个决策树来提高分类精度的模型。随机森林具有高准确率、处理高维数据的能力以及评估特征重要性等优点。
摘要由CSDN通过智能技术生成

决策树

信息熵

公式: H ( X ) = − ∑ x ∈ X P ( x ) l o g P ( x ) H(X)=-\sum_{x\in X}P(x)logP(x) H(X)=xXP(x)logP(x),H(X)称为X的信息熵,反映了X的信息量。
信息增益:g(D,A) = H(D)-H(D|A)为得知特征A下使得D的信息不确定性减少的程度。

信息增益的计算
H ( D ) = − ∑ k = 1 K ∣ C k ∣ ∣ D ∣ l o g ∣ C k ∣ ∣ D ∣ H(D)=-\sum_{k=1}^{K}\frac{|C_k|}{|D|}log\frac{|C_k|}{|D|} H(D)=k=1KDCklogDCk
H ( D ∣ A ) = ∑ i = 1 n ∣ D i ∣ ∣ D ∣ H ( D i ) H(D|A)=\sum_{i=1}^{n}\frac{|D_i|}{|D|}H(D_i) H(DA)=i=1nDDi

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值