决策树(三)cart算法

本文介绍了CART(Classification And Regression Tree)算法,一种用于数据挖掘的二叉决策树构建方法。CART通过递归划分数据集形成二叉树,并基于Gini不纯度选择最优划分点。在建树完成后,使用事后剪枝方法降低成本复杂性,防止过拟合。内容涵盖了CART的基本原理、建树过程和剪枝策略。
摘要由CSDN通过智能技术生成

1. CART算法的认识

 

Classification And Regression Tree,即分类回归树算法,简称CART算法,它是决策树的一种实现,通决策树主要有三种实现,分别是ID3算法,CART算法和C4.5算法。

 

CART算法是一种二分递归分割技术,把当前样本划分为两个子样本,使得生成的每个非叶子结点都有两个分支,此CART算法生成的决策树是结构简洁的二叉树。由于CART算法构成的是一个二叉树,它在每一步的决策时只能是“是”或者“否”,即使一个feature有多个取值,也是把数据分为两部分。在CART算法中主要分为两个步骤

 

(1)将样本递归划分进行建树过程

(2)用验证数据进行剪枝


2. CART算法的原理

 

上面说到了CART算法分为两个过程,其中第一个过程进行递归建立二叉树,那么它是如何进行划分的 ?

 

  • 2
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值