欢迎使用CSDN-markdown编辑器

最新推荐文章于 2021-01-07 23:01:28 发布

xiholix

最新推荐文章于 2021-01-07 23:01:28 发布

阅读量493

点赞数

分类专栏：数据挖掘文章标签： Ensemble

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/huhu0769/article/details/52014745

版权

数据挖掘专栏收录该内容

6 篇文章 0 订阅

订阅专栏

Ensemble Learning

目前的Ensemble Learning主要存在着三种类型分别是：bagging， boosting和stacking

bagging是通过从训练集中抽样出一些样本来训练各个基分类器。如果基分类器的相关程度较高将会导致Ensemble的效果降低，所以在bagging的时候需要尽量保证随机抽取的训练样本的差距较大。在随机抽样的时候既可以从训练样本中随机的抽取出实例加入基分类器的训练集中也可以随机的选择特征作为基分类器的特征。bagging方法是通过训练出不同的基分类器从而降低预测结果的方差，对于降低结果的偏差。所以这种方法的基分类器适合用具有低偏差而具有高方差的分类器。
boosting方法是迭代的训练，在下一轮的训练过程中会更加的注重上一轮预测错误的训练样本。所以通过不断的训练可以降低最后结果的偏差，而对方差没有什么太大的帮助。因此应该为该类型的方法选择一些具有高偏差但是具有低方差的基分类器。
stacking方法是为训练样本的每个特征训练一个分类器，然后将每个特征用基分类器的结果重新表示，再作为别的分类器的输入特征。

由于boosting和bagging的关注的方差和偏差的区别，所以在实际应用中随机森林往往要15层或者更高的节点才能取得好的结果，而GBDT只需要6层。因为随机森林关注的是方差所以要有更多的层的节点，从而使得基分类器具有较低的偏差。而GBDT需要较少的层数，来获得较低的方差

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

xiholix CSDN认证博客专家 CSDN认证企业博客

码龄12年

24: 原创

20万+: 周排名

48万+: 总排名

11万+: 访问

: 等级

1162: 积分

7: 粉丝

17: 获赞

21: 评论

13: 收藏

私信

关注

热门文章

分类专栏

业务安全 1篇
数据挖掘 6篇
爬虫 1篇
tensorflow 4篇
java 5篇
python 5篇

最新评论

tensorflow中embedding_lookup, tf.gather以及tf.nn.embedding_lookup_sparse的理解
li57681522: embedding_lookup讲的真难懂，简单点：idx%len(params)找到params第几个块，idx/len(params)找到这个块的第几行
tensorflow中embedding_lookup, tf.gather以及tf.nn.embedding_lookup_sparse的理解
moonfansLTH: 楼主 sparse_tensor 的weight你没用
pip ssl certificate verify failed
tbxgoo123: 给力，不忽悠
numpy.r_
ukuu: 楼主，你好，我最近也在学python，最近有个问题，一直没法解决因为这行代码，X = np.r_[np.random(20,2) - [2,2],np.random.randn(20,2) + [2,2]] 错误提示：TypeError: 'module' object is not callable 是因为我的numpy没有装好吗？但是numpy的其他函数我都可以用啊。

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。