1、决策树

  • 有监督学习的分类算法

一、概念准备

1.1 、信息熵

  • 系统有序程度的度量, 系统越有序信息熵越低。
  • 系统的混乱程度, H(u) 越大, 越无序, H(u) 越下, 越有序
  • 信息量的加权平均
    在这里插入图片描述

1.2、信息增益

  • 通常用来衡量某一个属性对于系统混乱程度的调整的幅度
  • 如何计算
    • 基于某一个属性计算他的条件熵, 他对于原来信息的该变量叫信息增益
      在这里插入图片描述

二、决策树准备

  1. 首先我们要收集足够多的数据,如果数据收集不到位,将会导致没有足够的特征去构建错误率低的决策树
  2. 数据特征充足,但是不知道用哪些特征好,也会导致最终无法构建出分类效果好的决策树。
  3. 从算法方面来看的话,决策树的构建就是我们的核心内容。

三、算法发展

3.1 ID3

  1. 筛选出具有分类能力的特征。如果利用一个特征进行分类的结果与随机分类的结果没有很大的差别,则称这个特征是没有分类能力的,经验上扔掉这些特征对决策树学习的精度影响不会很大。
  2. 我们希望随着划分, 节点纯度越高,衡量纯度的指标就是信息熵。

在这里插入图片描述

3.2 C4.5

  • 由于以上的缺点, 产生了C4.5
  • 相比于ID3有哪些优点
    • 取信息增益率, 绝对值变成了相对值
    • 剪枝, 防止过拟合
    • 可以处理非离散数据
    • 处理不完整数据
      在这里插入图片描述

3.3 CART 算法

在这里插入图片描述

3.4 C5.0

在这里插入图片描述
相关连接(笔记来自于视频课程的归类整理):
[1]: https://edu.cda.cn/my/course/966/material?type=material

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值