参考自【数据挖掘与R语言】
rpart包可实现回归树。通常分为两步建立回归树:1.生成一棵较大的树 2.通过统计估计删除一些结点来对树进行修剪。
回归树基础实现
library(rpart)
rpart(y~.,data=data1) 参数形式与lm()函数的参数形式相同
图形化展示:
plot(rm) text(rm)
rpart()函数构建树时,满足下列条件,树构建过程将结束:
1、偏差的减少小于某一个给定界限值时;
2、当结点中的样本数量小于某个给定界限时;
3、当树的深度大于一个给定的界限值
这3个界限值由rpart()函数中的三个参数(cp、minsplit、maxdepth)来确定。默认值为0.01、20、30
修剪方法
rpart包中实现了一种复杂度损失修剪的修剪方法
这个方法使用R在每个树结点计