Bagging算法是集成算法的一种,主要是通过随机等可能抽样得到若干不同的训练集,并利用这些训练集分别建立模型、对测试集样本所属类别进行预测,大多数模型将某个样本分为哪个类别,则该类别就最终判定为哪个类别。
1.在R中实现bagging算法的是adabag软件包中的bagging函数,其基本形式为:bagging(formula,data,mfinal=100,control)
其中formula表示建模公式,data为训练数据集,mfinal表示迭代次数,control参数与rpart中的control参数相同。
首先要安装并加载软件包。
代码如下:
install.packages("adabag")
install.packages("rpart")
library(adabag)
library(rpart)
2.读取数据集。
data=read.csv("shares_data1.csv",head=TRUE,encoding="utf-8")
names(data)=c("time",paste("x",1:35,sep=""),"y")#取列名
data$y=as.factor(data$y)
head(data);dim(data)