装袋法优势:
1.有效降低了预测的方差
2.具有更好的预测效能
3.可以提供内在的预测效能估计
装袋法局限:
1.计算量
2.解释性差
如何用R建立装袋树?
先得到自变量和因变量
> library(caret)
> library(pROC)
> dat=read.csv("https://raw.githubusercontent.com/happyrabbit/DataScientistR/master/Data/SegData.csv")
> trainx=dat[,grep("Q",names(dat))]
> trainx$segment=dat$segment
> trainy=dat$gender
>
> set.seed(1000)
> bagTune=caret::train(trainx,trainy,method="treebag",nbagg=1000,metric="ROC",trControl=trainControl(method="cv",summaryFunction=twoClassSummary,classProbs=TRUE,savePredictions=TRUE))