集成学习(Ensemble Learning)

最新推荐文章于 2023-05-27 15:19:17 发布

elisa_gao

最新推荐文章于 2023-05-27 15:19:17 发布

阅读量1.3k

点赞数

分类专栏： ML 文章标签： Ensemble Learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/haimengao/article/details/38259435

版权

ML 专栏收录该内容

25 篇文章 0 订阅

订阅专栏

1、集成学习主要采用“三个臭皮匠抵过一个诸葛亮”的思想，集成了多个较为弱小的学习器，以使得实验获得好的效果

产生历史：结合多个分类器比一个分类器的方法还要好

2、构造集成器的方法

可以采用majority voting来进行classification或者使用weighted average来进行regression

为了要得到一个好的分类器，base learners必须要尽可能的准确，尽可能的多样化。已经有很多人来研究

学习器的准确率，但是很少人能用一个准确的方式来定义diversity。定义多样化方式的衡量方法可以有很多中，

如何从训练样本中进行抽样，控制属性，控制输出，将随机性引入学习方法。不同base learners的结合

或者采用技术导致了各种集成方法。

3、代表性的方法有三种：Boosting Bagging Stacking

Boosting

首先，为所有的数据分配相等的权重，

然后，使用训练数据来测试算法ht,并且增加那些不正确分类的数据的权重。

每个学习算法的权重也在学习过程中被确定。可以用T种的学习器，每个学习器都会有一个分类结果，

如果发现分类结果不准确，那么那个训练数据例子的权重也会增加，同时，也会计算学习器t的权重。

最后再对每个学习器的权重和学习器判别结果进行乘积，得到判别结果。

Bagging

1、选择some bootstrap sample，每个学习器选择的例子可能都不同。原例子出现的概率至少为0.632，可能用其他的label

来代替原训练数据的label。

2、对选择出来的sample进行训练。

最后output的时候采用了majority voting的方法。选择使得所有分类learner的大部分都分类的结果。

Stacking:

先用所有的学习算法构造所有学习器

构建一个新的数据空集，每次都把学习器判别的结果加入数据集，那么数据集合就会变得比以前还要大。

然后对新的数据集进行分类，学习。

选择所有的学习器并不一定比全部都选择的好，many could be more better than all.

集成学习不仅可以用来做分类和回归，还可以用来聚类，或者其他的机器学习任务。

为什么选择一个学习器不一定比所有的学习器都要好呢？

1、训练数据可能不能提供足够的信息来选择准确的学习器，很多学习器的效果都是相当的。尝试着结合所有的

学习器可能是个better choice

2、每个学习器可能会达到一个次优的结果，所有的搜索结果都不是那么完美的。

3、搜索结果可能不包含最好的那个函数。

应用：文本分类、医药检测

总结：

1、目前没有比较好的多样性度量

2、集成学习器的方法还没有很好的为用户所了解。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
2
评论
集成学习(Ensemble Learning)

1、集成学习主要采用“”
复制链接

扫一扫

专栏目录

elisa_gao CSDN认证博客专家 CSDN认证企业博客

码龄14年

69: 原创

75万+: 周排名

184万+: 总排名

19万+: 访问

: 等级

2315: 积分

21: 粉丝

21: 获赞

17: 评论

64: 收藏

私信

关注

热门文章

分类专栏

VIM 6篇
linux 3篇
Python 17篇
English 3篇
svn 1篇
algorithm 1篇
Xpath 1篇
NLP 8篇
C 2篇
C++ 7篇
putty 1篇
NLP
ML 25篇
MPI 1篇
ID_Language 1篇
markdown编辑 1篇

最新评论

在VS2012中C++嵌入python
m0_69859923: 这样操作之后，具体可以干什么呀？有对应的实例吗
K-means(tri)利用三角不等式性质加速k-means
zz__dm: 你好，谢谢楼主的分享，我最近遇到了三角形不等式优化kmeans ，不知道代码实现方面您可以给点意见吗，要用if 判断去优化吗？感觉这样很笨呀，好像也可以不用，您有什么意见，谢谢
分类&回归算法-随机森林
我再也不吃糖了: 博主你好，我想请问一下，能不能在同一棵树采用分类与回归相结合呢？（数据是分类数据与数值型数据各占一半那种）
在VS2012中C++嵌入python
元气少女缘结神: 我试过C++嵌普通的python程序可以，但是如果python中有io.imread或别的库的imread之类的函数就不行？
python 安装模块
小目标一个亿: 不行，我试过了

大家在看

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。