&&机器学习实战&&AdaBoost算法

本文深入探讨了AdaBoost算法,一种流行的元算法,用于提升弱分类器的性能。文章从概述开始,介绍了数据集多重抽样、bagging和boosting的概念。接着,详细讲解了AdaBoost如何基于单层决策树构建弱分类器,并给出了完整的AdaBoost算法实现。此外,还对比了AdaBoost与SVM的区别,并讨论了非均衡分类问题及其处理方法,包括过抽样、欠抽样和代价敏感学习。
摘要由CSDN通过智能技术生成

1.概述

当做重要决定时,大家可能都会考虑吸取多个专家而不只是一个人的意见。机器学习也是。这就是元算法(meta algorithm)背后的思路。元算法是对其他算法进行组合的一种方式。AdaBoost是目前最流行的元算法。

单层决策树(decision stump)分类器之上,应用AdaBoost分类器。

2.基于数据集多重抽样的分类器

 前面介绍的五种不同的分类算法各有优缺点,将不同的分类器组合起来,这种结果称为集成方法或者元算法。使用集成方法时会有多种形式:可以是不同算法的集成,也可以是同一算法在不同设置下的集成,还可以是数据集不同部分分配给不同分类器之后的集成。

adaboost:

优点:泛化错误率低,易编码,可以应用在大部分分类器上,无参数调整。

缺点:对离群点敏感。

适用数据类型:数值型和标称型数据。

3.bagging:基于数据随机重抽样的分类器构建方法

            自举汇聚法(bootstrap aggregating),也称bagging方法,是在原始数据集选择S次后得到S个新数据集的一种技术。新数据集和原数据集的大小相等。每个数据集都是通过在原始数据集中随机选择一个样本来进行替换而得到的。这里的替换就意味着可以

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值