机器学习2-决策树的构建要点

决策树

优点:计算复杂度不高,输出结果易于理解,中间值的缺失对其影响较小,可以处理无关联的“特征数据”。
缺点;容易产生过度匹配。
适用数据类型:数值型和标称型。

构建决策树的注意点

  1. 找到决定性特征(数据集的某个特征在划分数据分类时起确定作用,我们必须找到这个特征)
  2. 评估每个特征(为了找到决定性特征,划分出最佳结果)

一般设想思路

  1. 测试结束后,原始数据被划分为几个“数据子集”
  2. 几个“数据子集”在第一个决策点的所有分支上。这是如果有某个分支下的数据属于同一类型,则这些数据已经已经被正确的划分数据类型。相反数据子集内的数据不属于同一类型,则需要继续重复划分数据子集的类型,直到所有具有相同类型的数据都在一个数据子集中!(这里划分数据子集的方法和划分原始数据的方法一致,都是找到决定性特征,进行归类)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值