<机器学习><详解>Ensemble 集成学习算法

集成学习Ensemble通过结合多个基分类器的预测,如KNN、朴素贝叶斯和逻辑回归,实现更优的分类效果。通过投票或加权投票决定最终结果,其中基分类器应具有良好性能且相互独立。Bagging和Boosting是两种常用策略,前者通过随机子集创建分类器,后者迭代改进难以分类的样本。AdaBoost是Boosting的一种,而随机森林通过随机特征子集构建决策树,降低相关性并提高整体准确性。
摘要由CSDN通过智能技术生成

Ensemble 集成学习

什么是集成学习思想?

  1. 将多个分类器的预测结果结合起来
  2. 用来组合的分类器叫做 基分类器(base classifiers)
  3. Ensembles通常比组成他的基分类器效果好
  4. 我们使用投票(少数服从多数)或加权投票来决定最终结果

Example:

  1. 训练KNN,朴素贝叶斯,逻辑回归这三种分类器

  2. 对一个新样本分类时,结合三个分类器的结果,少

    数服从多数

集成学习的错误率:

  • 当一个ensemble由25个相同的基分类器组成,那么 他的错误率就等于基分类器的错误率.

  • 当一个ensemble由25个不同的基分类器组成,那么 只有当超过半数的基分类器都错误的情况下,他才 会预测错误
    请添加图片描述

让集成学习效果更好:

  1. 基分类器需要表现良好,即他的错误率低于0.5
  2. 基分类器之间相互独立
    • 不可能保证完全相互独立
    • 在基分类器相关性较低的情况下,集成学习就可以获得不错的表现
  3. 好的ensemble需要多种多样的并且效果良好的基类器组成

如何在基分类器之间产生不一致(独立性):

    评论
    添加红包

    请填写红包祝福语或标题

    红包个数最小为10个

    红包金额最低5元

    当前余额3.43前往充值 >
    需支付:10.00
    成就一亿技术人!
    领取后你会自动成为博主和红包主的粉丝 规则
    hope_wisdom
    发出的红包
    实付
    使用余额支付
    点击重新获取
    扫码支付
    钱包余额 0

    抵扣说明:

    1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
    2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

    余额充值