R语言：bagging算法的实现——adabag

最新推荐文章于 2023-04-07 22:34:08 发布

weixin_43216017

最新推荐文章于 2023-04-07 22:34:08 发布

阅读量5.9k

点赞数 6

分类专栏：机器学习编程 R语言分类算法原理以及R&Python实现文章标签： R bagging

本文链接：https://blog.csdn.net/weixin_43216017/article/details/87880586

版权

在前一篇文章中，我们介绍了bagging算法，本文我们将着重介绍其R语言的实现。

使用adabag包中的bagging函数

数据简介

本文数据选择了红酒质量分类数据集，这是一个很经典的数据集，原数据集中“质量”这一变量取值有{3，4，5，6，7，8}。为了实现二分类问题，我们添加一个变量“等级”，并将“质量”为{3，4，5}的观测划分在等级0中，“质量”为{6，7，8}的观测划分在等级1中。

数据下载戳我

因变量：等级

自变量：非挥发性酸性、挥发性酸性、柠檬酸、剩余糖分、氯化物、游离二氧化硫、二氧化硫总量、浓度、pH、硫酸盐、酒精

####数据集的引入及划分
library(openxlsx)
wine = read.xlsx("C:/Users/Mr.Reliable/Desktop/classification/winequality-red.xlsx") 
#将数据集分为训练集和测试集,比例为7:3
train_sub = sample(nrow(wine),7/10*nrow(wine))
train_data = wine[train_sub,]
test_data = wine[-train_sub,]