CART模型

CART(Classification and Regression Tree)是一种广泛使用的决策树学习方法,适用于分类和回归任务。在构建二叉树的过程中,通过最小化平方误差或基尼指数来选择最优切分。回归树通过将特征空间划分为多个单元并分配固定输出值,而分类树则是通过基尼指数选择最优特征和切分点。剪枝过程通过权衡模型复杂度和预测误差来提高泛化能力,其中固定参数a的剪枝方法通过比较不同子树的损失函数来确定最佳子树。
摘要由CSDN通过智能技术生成

(一)简介

1.CART(classification and regression tree)是应用广泛的决策树学习方法,既可以用于分类也可以用于回归;

2.CART假设决策树是二叉树,内部结点特征的取值为“是”和“否”,这样的决策树等价于递归地二分每个特征,将输入空间即特征空间划分为有限个单元,并在这些单元上确定预测值或者类别;

(二)回归树

1.一个回归树对应着特征空间的一个划分以及在划分的单元上的输出值;假设已将输入空间划分为M个单元,并且在每个单元上都有一个固定的输出值Cm,于是回归树的模型可表示为:


2.回归树模型的学习:在训练数据集所在的特征空间中,递归地将每个区域划分为两个子区域并决定每个子区域上的输出值,构建二叉决策树;

(1)选择最优切分变量 j 和切分点 s ,求解:


遍历变量j,对固定的切分变量j 扫描切分点s,选择使上述预测误差(也就是平方误差)达到最小值的对(j,s);

(2)继续对两个子区域调用步骤(1)直至满足停止条件;

(3)将输入空间划分为M个区域,生成决策树:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值