机器学习信仰之决策树

1、决策树是一种基本的分类、回归算法
2、1986年ID3算法;1994年C4.5算法;1984年CART算法
3、决策树从根节点到一个叶节点表示一条路径,代表一串规则、条件。
4、决策树考量的是叶节点代表的条件概率,是判别模型
5、决策树算法包括特征选择、树的生成、剪枝三个步骤。 由于决策树表示一个条件概率分布,所有不同的树的深度代表不同复杂度的概率模型;决策树的生成对应模型的局部选择,剪枝对应模型的全局选择。 决策树的生成只考虑局部最优,剪枝考虑全局最优

熵、信息增益、信息增益比、基尼系数

熵 — 度量随机变量的不确定性(纯度)

定义:假设随机变量X是一个取有限个数的离散随机变量,其概率分布为:
其概率 P(X=xi) = pi , ( i = 1,2, … , n)
因此随机变量X的熵:

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值