为了加强模型的泛化能力,有时候需要打乱数据集(包括特征数据和标签),但是显然还是要保证每一条数据中的特征数据和标签的对应关系
可以进行如下操作:
1、使用索引index的形式
from numpy import*
import random
data=array([[1,1],[1,2],[1,3],[1,4],[1,5]])
label=array([1,2,3,4,5])
index = [i for i in range(len(data))]
random.shuffle(index)
data = data[index]
label = label[index]
print(data)
print(label)
输出
[[1 5]
[1 1]
[1 2]
[1 4]
[1 3]]
[5 1 2 4 3]