机器学习-有监督学习-分类算法:决策树算法【CART树:分类树(基于信息熵;分类依据:信息增益、信息增益率、基尼系数)、回归树(基于均方误差)】【损失函数:叶节点信息熵和】【对特征具有很好的分析能力】

本文详细介绍了决策树算法,包括CART树(分类和回归树)的概念,分类树的构建依据如信息熵、信息增益、基尼系数,以及分类树和回归树的区别。通过scikit-learn库展示了分类树的API用法,并探讨了随机森林的构建过程、优点和应用。随机森林是通过集成多个决策树来提高分类准确性和抗过拟合能力。
摘要由CSDN通过智能技术生成

一、决策树概述

注:生产实践中,不使用决策树,太简单,而是使用决策树的升级版:集成学习算法
集成学习算法有:

  • Random Forest(随机森林)
  • Extremely Randomized Forest(极限随机森林)
  • Adaboost提升树
  • GBDT(梯度提升树)
  • XGBoost(极端梯度提升树)
  • LightGBM

注:企业重要决策,由于决策树很好的分析能力,在决策过程应用较多(比如:XGBoost), 可以选择特征

1、决策树概念

决策树思想的来源非常朴素,程序设计中的条件分支结构就是if-else结构,最早的决策树就是利用这类结构分割数据的一种分类学习方法。
在这里插入图片描述

  • 决策树算法采用的是自顶向下递归
  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值