数据划分——自助法代码实现

最新推荐文章于 2024-04-14 23:27:33 发布

我啊困的唉

最新推荐文章于 2024-04-14 23:27:33 发布

阅读量5k

点赞数 3

分类专栏： python 机器学习

本文链接：https://blog.csdn.net/ahc176/article/details/120276666

版权

概率论机器学习

python 同时被 2 个专栏收录

16 篇文章 0 订阅

订阅专栏

机器学习

8 篇文章 0 订阅

订阅专栏

自助法：给定包含m个样本的数据集D DD，我们对它进行采样产生数据集D′ D'D ′ ：每次随机从D DD中挑选一个样本，将其复制到D′ D'D ′ 中，然后再将其样本放回原始数据集D DD中，使得该样本在下次采样的时候也可能被采到；这个过程重复执行m次，我们就得到了包含m个样本的数据集D′ D'D ′ 。简而言之，就是从数据集D DD中，有放回随机采样m次，组成一个新样本集D′ D'D ′ 。

import numpy as np
x= np.random.randint(-10,10,10)
y=(x>0).astype(int)
bootstrapping=[]
for i in range(len(x)):
    bootstrapping.append(np.floor(np.random.random()*len(x)))
x_1=[]
y_1=[]
for i in range(len(x)):
    x_1.append(x[int(bootstrapping[i])])
    y_1.append(y[int(bootstrapping[i])])
print(x_1)
print(y_1)

结果：