机器学习 - 手动实现自助法

本文介绍了如何使用自助法(bootstrapping)在sklearn库中对Iris数据集进行采样,每次从原始数据集中随机选取样本构成训练集和测试集,以评估模型性能。
摘要由CSDN通过智能技术生成

自助法 (bootstrapping):以自助采样法为基础,对含有m个样本的数据集D, 每次随机从D中挑选一个样本,放入D’中,然后将样本放回D中,重复m次之后,得到了包含m个样本的数据集D’,将D’作为训练集,用数据集D中没有出现在训练集D’中的样本作为测试集。

代码如下:

from sklearn.datasets import load_iris
from sklearn.utils import resample 

iris = load_iris()
x = iris.data 
y = iris.target 

n_iterations = 1000

train_sizes = []
test_sizes = []

for _ in range(n_iterations):
    x_bootstrap, y_bootstrap = resample(x, y, replace=True)

    split_index = len(x_bootstrap) // 3
    x_test = x_bootstrap[:split_index]
    x_train = x_bootstrap[split_index:]

print(len(x_test))
print(len(x_train))

结果如下:

50
100

创作不易,点个赞支持一下咯~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值