监督学习算法(一):决策树算法

一. 决策树算法

1. 机器学习中分类和预估算法的评估:准确率,速度,强壮性,可规模性,可解释性。

2. 什么是决策树? 每个内部节点表示在一个属性上的测试,每个分支代表一个属性输出,而每个树叶节点代表类或者类分布,树的最顶层是根节点。

3. 什么是信息熵? 变量的不确定性越大,熵也就越大。

4. 决策树归纳算法(ID3)

根据信息熵的差值来判断以一个信息熵为基础所获得的信息量,信息量大的作为根节点。

对剩下的每个属性已知的值,创建一个分支,并再次根据这个划分样本。实际就是递归。

在具体编写代码的时候要注意一点就是每个节点的属性要转化成计算机能够识别的东西。

5. 决策树不适用于处理连续变量,因为设置阈值最终可能会对结果有一定的影响。

6. 决策树容易过拟合,假如说1000条数据都没有重复的。层数多可能就会造成过拟合。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值