数据挖掘学习——集成学习(classifier combination)

目录

1.集成学习基本思路

2.集成学习模型结合策略

(1)平均法&加权平均法(集成回归模型的结合策略)

(2)相对多数投票法&加权投票法(集成分类模型的结合策略)

 3.Bagging方法和随机森林

(1)Bagging方法

 (2)随机森林(random forest)

4.Boosting方法和Adaboost

(1)Boosting方法

(2)Adaboost方法

5.集成学习python实现


1.集成学习基本思路

集成学习(classifier combination)将多个数据挖掘模型(基模型,base classifier)集成在一起进行学习。多个基模型对数据集进行学习,并分别输出结果,然后集成学习模型再通过一定的方法将这些结果进行整合,最终形成集成学习模型的结果。

2.集成学习模型结合策略

(1)平均法&加权平均法(集成回归模型的结合策略)

简单平均法:

 加权平均法:

(相比于简单平均法,增加了权重系数参数,更容易出现过拟合)

 实际使用过程中发现,加权平均法的结果有时还不如简单平均。

(2)相对多数投票法&加权投票法(集成分类模型的结合策略)

相对多数投票法:

获得最多票数的类别为集成模型的输出类别(若有多个类别获得相同的最高票,则随机从这些类别中选取一个作为最终的输出。)

  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值