机器学习之决策树简介

决策树是一种监督学习算法,常用于分类和回归。它通过属性测试建立树形结构,内部节点代表属性测试,叶节点代表类别。ID3、C4.5和CART是常见的决策树算法。信息熵和信息增益是选择节点的重要依据,防止过拟合的剪枝处理也是关键。决策树易于理解和解释,但易过拟合,需要优化。
摘要由CSDN通过智能技术生成

综述

  • 一种非常常用的机器学习算法,属于监督学习,可以用于分类和回归。
  • 每个内部节点表示在一个属性上的测试,每个分支代表当前测试的输出。每个叶节点代表类别。
  • 根据属性的值分类。得到的新节点是根据属性分后的实例
  • 当新节点内,所有的实例都是同一个标记的时候,停止分类
  • 自顶向下,基本思想是以信息熵为度量,构造一棵熵值下降最快的树,直到熵的值最终为0。
  • 可能是最常使用的数据挖掘算法,主要有ID3,X4.5,CART
  • 可能会过度预测,看情况进行剪枝

算法构造

流程图的树结构,对属性测试,判断,然后输出。
判断生成的子节点是否满足停止分割的条件。
节点:属性
分支:根据属性的值的情况,决定分支的个数。

算法流程

决策树本质是个递归过程。判属性–>创分支–>选属性–>递归结束条件。
用伪代码总结执行步骤如下

伪代码:
    if 符合结束条件 return 类标签
    else
        计算/寻找最适合的特征
        划分分支
        创建新子集
            for 每个子集
                调用本段代码并增加返回结果到分直接点中
        <
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值