Python如何打乱训练数据集的顺序

最新推荐文章于 2024-05-22 22:20:41 发布

fff2zrx

最新推荐文章于 2024-05-22 22:20:41 发布

阅读量2.3w

点赞数 19

分类专栏： Python

本文链接：https://blog.csdn.net/qq_38412868/article/details/85473973

版权

Python 专栏收录该内容

102 篇文章 10 订阅

订阅专栏

为了加强模型的泛化能力，有时候需要打乱数据集（包括特征数据和标签），但是显然还是要保证每一条数据中的特征数据和标签的对应关系

可以进行如下操作：

1.通过随机化index

import random
index = [i for i in range(len(data))] 
random.shuffle(index)
data = data[index]
label = label[index]

2.将数据集特征数据和标签先整合成一个array再随机化行的顺序

s_data = np.array([data, labels])#假设data和labels均为二维数组
s_data = s_data.transpose(1,0,2)
np.random.shuffle(s_data)
 
data = s_data[:,0,:]     
labels = s_data[:,1,:]

PS:numpy中函数shuffle与permutation都是对原来的数组随机打乱原来的顺序，shuffle中文含义为洗牌，permutation中文含义为排列，区别在于shuffle直接在原来的数组上进行操作，改变原来数组的顺序，无返回值。而permutation不直接在原来的数组上进行操作，而是返回一个新的打乱顺序的数组，并不改变原来的数组。

import numpy as np
a = np.arange(9)
print("a:",a)
np.random.shuffle(a)
print("a:",a)
b = np.random.permutation(a)
print("b:",b)
print("a:",a)

输出为：

a: [0 1 2 3 4 5 6 7 8]
a: [1 7 8 0 5 3 2 4 6]
b: [5 1 8 3 6 4 2 7 0]
a: [1 7 8 0 5 3 2 4 6]

fff2zrx

关注

19
点赞
踩
87

收藏

觉得还不错? 一键收藏
打赏
2
评论
Python如何打乱训练数据集的顺序

为了加强模型的泛化能力，有时候需要打乱数据集（包括特征数据和标签），但是显然还是要保证每一条数据中的特征数据和标签的对应关系可以进行如下操作：1.通过随机化indeximport randomindex = [i for i in range(len(data))] random.shuffle(index)data = data[index]label = label[in...
复制链接

扫一扫