重要参数:
criterion
回归树衡量分枝质量的指标,支持的标准有三种:
1
)输入
"mse"
使用均方误差
mean squared error(MSE)
,父节点和叶子节点之间的均方误差的差额将被用来作为特征选择的标准,这种方法通过使用叶子节点的均值来最小化L2
损失
2
)输入
“friedman_mse”
使用费尔德曼均方误差,这种指标使用弗里德曼针对潜在分枝中的问题改进后的均方误差
3
)输入
"mae"
使用绝对平均误差
MAE
(
mean absolute error
),这种指标使用叶节点的中值来最小化
L1
损失
属性:
最重要的是
feature_importances_
接口:
apply, fifit, predict, score
最核心。
注:
几乎所有参数,属性及接口都和分类树一模一样。需要注意的是,在回归树中,没有标签分布是否均衡的问题,因此没有class_weight
这样的参数。
在回归树中,MSE不只是我们的分枝质量衡量指标,也是我们最常用的衡量回归树回归质量的指标,当我们在使用交叉验证,或者其他方式获取回归树的结果时,我们往往选择均方误差作 为我们的评估(在分类树中这个指标是score代表的预测准确率)。在回归中,我们追求的是,MSE越小越好。 然而,回归树的接口score返回的是R平方(R平方可以为正为负(如果模型的残差平方和远远大于模型的总平方和,模型非常糟糕,R平方就会为负),而均方误差永远为正。 ),并不是MSE。
(根据菜菜的机器学习整理)