Python算法总结(九)集成算法

本文介绍了集成算法的概念,包括Bagging(如随机森林)、Boosting(如Adaboost和XGBoost)以及Stacking。讨论了各方法的原理、特点和差异,并提到了Python中实现这些算法的xgboost库。
摘要由CSDN通过智能技术生成

注:本篇文章不涉及模型参数调优。参数调优是一个重要的大话题。

1、什么是集成算法?
多个模型集成在一起的模型叫做集成评估器ensemble estimator,组成集成评估器的每个模型都叫做基评估器base estimator或弱学习器。

2、集成算法有哪些?
装袋法Bagging
提升法Boosting
堆叠法Stacking

3、什么是装袋法Bagging?
Bagging选用相同的弱学习器作为基模型,每个基模型的训练数据不是全部的数据集,而是通过“有放回的随机抽样”得到的随机子集,预测时各个基模型进行权重投票,是一种并行的训练结构。袋装法的典型代表是随机森林。

在这里插入图片描述
4、什么是随机森林Random Forest?
随机森林是Bagging的一种改进。
随机体现在:样本选择的随机性,特征选择的随机性。
森林体现在:所有弱分类器都是分类回归树(CART二叉树)。
随机森林的特点:对异常值不敏感,模型不易过拟合,要求基模型准确率大于0.5。
随机森林包含随机森林分类器、随机森林回归器。
随机森林的用途:可用于特征筛选。

5、什么是提升法Boosting?
Boosting选用相同的弱分类器作为基模型,依次训练模型,每个基模型的训练数据会根据

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值