一、什么是CART
CART(Classification And Regression Tree)是决策树家族中的一种算法,也是十大算法中的一种。根据其名字可以将CART分成三种:a. 回归树(Classification Tree),b.回归树(Regression Tree)。本文简单介绍些利用最小剩余方差法(Squared Residuals Minimization)来判定回归树的最优划分,这个准则期望划分之后的子树与样本点的误差方差最小。
在创建回归模型时,样本的取值分为观察值和输出值两种。当观察值和输出值都是连续的,而不是分类标签时,只有根据数据集的数据特征来创建一个预测的模型,进而反映出曲线的变化趋势。CART使用最小剩余方差法来判定回归树的最优划分,该准则是期望划分之后的子树误差方差最小。创建模型树,每个叶子节点则是一个机器学习模型,如线性回归模型。