13集成算法与随机森林(Bagging、Boosting、Stacking)

本文是唐宇迪《python数据分析与机器学习实战》的学习笔记,主要探讨了三种集成算法:Bagging模型(如随机森林)通过并行训练多棵树并取平均来提高准确率;Boosting模型(如AdaBoost、Xgboost)通过串行构建弱学习器逐步减小误差;Stacking模型利用多个模型的预测结果作为新特征来提升预测性能。
摘要由CSDN通过智能技术生成

唐宇迪《python数据分析与机器学习实战》学习笔记
13集成算法与随机森林

竞赛题使用较多中准确率较高,三种集成算法
在这里插入图片描述

1.Bagging模型

(并形算法)

并行训练多棵树,结果累加取平均。随机森林构造了N棵树,最终结果把树进行分类取众数。
二重随机性:数据采样随机性(例如100个有放回选60-80个),特征随机性(寻则部分特征)
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
特征重要性比较原理
举例:比如ABCD四个特征,B为年龄(36、27、65…),用着四个特征建模错误率为

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值