自助法 (bootstrapping):以自助采样法为基础,对含有m个样本的数据集D, 每次随机从D中挑选一个样本,放入D’中,然后将样本放回D中,重复m次之后,得到了包含m个样本的数据集D’,将D’作为训练集,用数据集D中没有出现在训练集D’中的样本作为测试集。
代码如下:
from sklearn.datasets import load_iris
from sklearn.utils import resample
iris = load_iris()
x = iris.data
y = iris.target
n_iterations = 1000
train_sizes = []
test_sizes = []
for _ in range(n_iterations):
x_bootstrap, y_bootstrap = resample(x, y, replace=True)
split_index = len(x_bootstrap) // 3
x_test = x_bootstrap[:split_index]
x_train = x_bootstrap[split_index:]
print(len(x_test))
print(len(x_train))
结果如下:
50
100
创作不易,点个赞支持一下咯~