机器学习模型训练中,经常需要打乱数据集,用 zip() 函数可以实现如下:
import random
X = [1, 2, 3, 4, 5, 6]
y = [0, 1, 0, 0, 1, 1]
zipped_data = list(zip(X, y))
# 将样本和标签一 一对应组合起来,并转换成list类型方便后续打乱操作random.shuffle(zipped_data)
# 使用random模块中的shuffle函数打乱列表,原地操作,没有返回值
new_zipped_data = list(map(list, zip(*zipped_data)))
# zip(*)反向解压,map()逐项转换类型,list()做最后转换
new_X, new_y = new_zipped_data[0], new_zipped_data[1]
# 返回打乱后的新数据
print('X:',X,' ','y:',y)
print('new_X:',new_X, ' ', 'new_y:',new_y)
输出结果(因未设置随机种子seed,因此每次运行结果可能不一样):
X: [1, 2, 3, 4, 5, 6]
y: [0, 1, 0, 0, 1, 1]
new_X: [1, 2, 3, 4, 5, 6]
new_y: [0, 1, 0, 0, 1, 1]
Conan
Conan
103***7367@qq.com4个月前 (07-14)