主要原因是特征分裂的评价标准不一样,cart有两种评价标准:Variance和Gini系数。
而ID3(信息增益)和C4.5(信息增益率)的评价基础都是信息熵。
信息熵和Gini系数是针对分类任务的指标,而Variance是针对连续值的指标因此可以用来做回归。
此外,CART生成的树是二叉树,回归时的损失函数是最小化均方差,预测值等于该节点所有值的平均。
参考:https://www.zhihu.com/question/299719792/answer/807545759
主要原因是特征分裂的评价标准不一样,cart有两种评价标准:Variance和Gini系数。
而ID3(信息增益)和C4.5(信息增益率)的评价基础都是信息熵。
信息熵和Gini系数是针对分类任务的指标,而Variance是针对连续值的指标因此可以用来做回归。
此外,CART生成的树是二叉树,回归时的损失函数是最小化均方差,预测值等于该节点所有值的平均。
参考:https://www.zhihu.com/question/299719792/answer/807545759