《机器学习实战中文版》利用AdaBoost元算法提高分类性能

最新推荐文章于 2024-07-24 14:05:30 发布

香槟酒气满天飞

最新推荐文章于 2024-07-24 14:05:30 发布

阅读量101

点赞数

分类专栏：啃书笔记（机器学习实战中文版）文章标签：机器学习

本文链接：https://blog.csdn.net/kangxiatao/article/details/109345768

版权

10 篇文章 0 订阅

订阅专栏

基于数据集多重抽样的分类器
将不同的分类器组合起来，组合有多种形式：不同算法的，也可以是同一算法不同设置，还可以是数据集和分类器都不同，书上主要对AdaBoost进行了实现
前人栽树，后人乘凉
AdaBoost全称是自适应增强算法，是顺序级联的结构，使用的分类器类型是一样的，分类的结果是基于所有分类器的加权求和结果，每个权重代表的是其对应分类器在上一轮迭代中的成功度
优点：泛化错误率低，易编码，可以应用在大部分分类器上，无参数调整。
缺点：对离群点敏感。
适用数据类型：数值型和标称型数据。

可以把弱分类器想象成SVM中的一个核函数，也可以按照最大化某个最小间隔的方式重写AdaBoost算法。而它们的不同就在于其所定义的间隔计算方式有所不同，因此导致的结果也不同。特别是在高维空间下，这两者之间的差异就会更加明显。（这一段是书上的原话，并没有很理解，可能在几何上可以理解为类似的方式）

关注