三、机器学习之旅-决策树篇(1)理论概念


决策树是一种基本的分类和回归的方法,本章主要讨论分类的决策树。

一、决策树的介绍和应用

1.1决策树介绍

决策树是一种常见的分类模型,在金融分析、医疗辅助诊断方面有着丰富广泛的应用;其核心思想是基于树结构对数据进行划分,即if-then规则的集合,这种思想是人类思考时最本能的思考方式。

例如在婚恋市场中,女方通常会先看男方有没有房产,其次看男方有没有车产,最后再看男方有没有稳定的工作等等···基于这些思考与判断,最后得出是否要和这位男方继续深入了解的判断。

决策树主要优点如下:

  1. 具有很好的可解释性,模型可以生成可以理解的规则;
  2. 可以发现特征的重要程度;
  3. 模型的计算复杂度比较低,分类速度快。

决策树的缺点如下:

  1. 模型容易过拟合,需要采取剪枝技术处理;
  2. 不能很好地利用连续性地特征;
  3. 预测能力比较有限,无法达到强监督效果;
  4. 方差较高,数据分布的轻微改变很容易导致树结构完全不同。

1.2 决策树的应用

由于决策树模型中自变量和 因变量的非线性关系以及决策树简单的计算方法,使得它成为了最为广泛使用的基模型。梯度提升树(GBDT),XGBoost,以及LightGBM等集成模型都采取了决策树作为基础模型。在广告计算、金融领域,大放异彩。已经成为当前与神经网络相提并论的复杂模型,更是数据挖掘比赛中的常客。

决策树在一些需要明确解释且提取分类规则的场景中被广泛使用,而其他的机器学习模型却很难做到这一点。比如在医疗辅助系统中,为了方便相关专业人士的决策,常常将决策树算法用于辅助病症检测。例如在一个哮喘病患者识别模型当中,许多高级模型的算法有时表现会非常差。这是因为这些算法会认为患有剧烈咳嗽的病人患哮喘病的概率很小,然而医生们非常清楚,剧烈咳嗽要立刻进行检查和治疗。因此,决策树模型可以用来帮助决策并民明确分类规则。

最近时间比较赶,下面的理论内容过后补上

二、决策树模型与学习

三、特征选择

四、生成决策树

五、决策树剪枝

六、CART决策树

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值