python打乱数据

最新推荐文章于 2024-05-22 22:20:41 发布

ODIMAYA

最新推荐文章于 2024-05-22 22:20:41 发布

阅读量1k

点赞数

本文链接：https://blog.csdn.net/ODIMAYA/article/details/104400625

版权

Pandas自带sample()函数：

df.sample(frac=1).reset_index(drop=True)

其中由于打乱后的数据，index会乱掉，需要重置index
在重置index后，旧的index默认会成为数据中的一列，因此设置参数drop=True，表示删掉旧的index

用sklearn.utils里面的方法

from sklearn.utils import shuffle
data = pd.read('data.csv')
data = shuffle(data)

用random方法

import random
data = pd.read('data.csv')
data = data.values
random.shuffle(data)

用numpy的random的permutation()或者shuffle()

a = np.arange(20).reshape(4,5)
b=np.random.permutation(a)
a
Out[86]: 
array([[ 5,  6,  7,  8,  9],
       [15, 16, 17, 18, 19],
       [10, 11, 12, 13, 14],
       [ 0,  1,  2,  3,  4]])
b
Out[87]: 
array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [15, 16, 17, 18, 19],
       [10, 11, 12, 13, 14]])
另外：
np.random.random.shuffle()就是random.shuffle(),用法一致

ODIMAYA

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
python打乱数据

Pandas自带sample()函数：df.sample(frac=1).reset_index(drop=True)其中由于打乱后的数据，index会乱掉，需要重置index在重置index后，旧的index默认会成为数据中的一列，因此设置参数drop=True，表示删掉旧的index用sklearn.utils里面的方法from sklearn.utils import shuff...
复制链接

扫一扫