bagging方法

最新推荐文章于 2021-04-17 21:19:39 发布

人生半熟

最新推荐文章于 2021-04-17 21:19:39 发布

阅读量987

点赞数

分类专栏：集成学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_38189533/article/details/113866744

版权

bagging

前言
一、数据采样----有放回的采样
二、使用步骤
- 1.引入库
- 2.读入数据
总结

前言

前篇文章介绍了集成学习的三种方式，本篇具体梳理bagging方式的详细过程和实现。
伪代码

一、数据采样----有放回的采样

1. 对一个包含 m 个样本的数据集，base learner有k个，进行 m 次有放回的随机采样，这样得到k个大小为m的采样集分别给k个模型进行训练。

2. 没有被采样到的样本作为验证集，因为是有放回的采样，所以采样到的样本有可能有重复样本。

3. 假设一个样本被抽取的概率是1/m，则抽样次数足够大时，一个样本不被抽到的概率为36.8%。在这里插入图片描述

二、使用步骤

1.引入库

代码如下（示例）：

import numpy as np
import pandas a

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
bagging方法

bagging前言一、数据采样----有放回的采样二、使用步骤1.引入库2.读入数据总结前言前篇文章介绍了集成学习的三种方式，本篇具体梳理bagging方式的详细过程和实现。一、数据采样----有放回的采样1. 对一个包含 m 个样本的数据集，base learner有k个，进行 m 次有放回的随机采样，这样得到k个大小为m的采样集分别给k个模型进行训练。2. 没有被采样到的样本作为验证集，因为是有放回的采样，所以采样到的样本有可能有重复样本。3. 假设一个样本被抽取的概率是1/m，则抽.
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。