R语言：Adaboost算法的实现——adabag

最新推荐文章于 2024-04-02 23:58:03 发布

weixin_43216017

最新推荐文章于 2024-04-02 23:58:03 发布

阅读量1.1w

点赞数 9

分类专栏：机器学习编程 R语言分类算法原理以及R&Python实现文章标签： R Adaboost adabag

本文链接：https://blog.csdn.net/weixin_43216017/article/details/87865929

版权

本文介绍了R语言中使用adabag包实现Adaboost算法的过程，通过红酒质量数据集进行二分类问题解决。详细讲解了数据简介、R包下载、Adaboost算法实现步骤，并展示了ROC曲线与AUC值的变化，指出迭代次数增加能提升AUC但可能影响运行速度。

摘要由CSDN通过智能技术生成

在前一篇文章中，我们介绍了Adaboost算法，本文我们将着重介绍其R语言的实现。

使用adabag包中的boosting函数

数据简介

本文数据选择了红酒质量分类数据集，这是一个很经典的数据集，原数据集中“质量”这一变量取值有{3，4，5，6，7，8}。为了实现二分类问题，我们添加一个变量“等级”，并将“质量”为{3，4，5}的观测划分在等级0中，“质量”为{6，7，8}的观测划分在等级1中。

数据下载戳我

因变量：等级

自变量：非挥发性酸性、挥发性酸性、柠檬酸、剩余糖分、氯化物、游离二氧化硫、二氧化硫总量、浓度、pH、硫酸盐、酒精

####数据集的引入及划分
library(openxlsx)
wine = read.xlsx("C:/.../winequality-red.xlsx") 
#将数据集分为训练集和测试集,比例为7:3
train_sub = sample(nrow(wine),7/10*nrow(wine))
train_data = wine[train_sub,]
test_data = wine[-train_sub,]

Adaboost算法实现

R包下载

install.packages("adabag")

这个包需要依赖很多其他的包，下载的时间相对较长

实现Adaboost算法

boosting(formula, data, boos = TRUE, mfinal = 100, coeflearn = ‘Breiman’,
control,…)

参数	意义
formula	$y$ ~

最低0.47元/天解锁文章

weixin_43216017

关注

9
点赞
踩
84

收藏

觉得还不错? 一键收藏
9
评论
R语言：Adaboost算法的实现——adabag

在前一篇文章中，我们介绍了Adaboost算法，本文我们将着重介绍其R语言的实现。数据简介本文数据选择了红酒质量分类数据集，这是一个很经典的数据集，原数据集中“质量”这一变量取值有{3，4，5，6，7，8}。为了实现二分类问题，我们添加一个变量“等级”，并将“质量”为{3，4，5}的观测划分在等级0中，“质量”为{6，7，8}的观测划分在等级1中。数据下载戳我因变量：质量自变量：非挥发性...
复制链接

扫一扫

专栏目录