自助法: 给定包含m个样本的数据集D DD,我们对它进行采样产生数据集D′ D'D ′ :每次随机从D DD中挑选一个样本,将其复制到D′ D'D ′ 中,然后再将其样本放回原始数据集D DD中,使得该样本在下次采样的时候也可能被采到;这个过程重复执行m次,我们就得到了包含m个样本的数据集D′ D'D ′ 。简而言之,就是从数据集D DD中,有放回随机采样m次,组成一个新样本集D′ D'D ′ 。
import numpy as np
x= np.random.randint(-10,10,10)
y=(x>0).astype(int)
bootstrapping=[]
for i in range(len(x)):
bootstrapping.append(np.floor(np.random.random()*len(x)))
x_1=[]
y_1=[]
for i in range(len(x)):
x_1.append(x[int(bootstrapping[i])])
y_1.append(y[int(bootstrapping[i])])
print(x_1)
print(y_1)
结果: