python打乱数据

Pandas自带sample()函数:

df.sample(frac=1).reset_index(drop=True)

其中由于打乱后的数据,index会乱掉,需要重置index
在重置index后,旧的index默认会成为数据中的一列,因此设置参数drop=True,表示删掉旧的index

用sklearn.utils里面的方法

from sklearn.utils import shuffle
data = pd.read('data.csv')
data = shuffle(data)

用random方法

import random
data = pd.read('data.csv')
data = data.values
random.shuffle(data)

numpyrandompermutation()或者shuffle()

a = np.arange(20).reshape(4,5)
b=np.random.permutation(a)
a
Out[86]: 
array([[ 5,  6,  7,  8,  9],
       [15, 16, 17, 18, 19],
       [10, 11, 12, 13, 14],
       [ 0,  1,  2,  3,  4]])
b
Out[87]: 
array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [15, 16, 17, 18, 19],
       [10, 11, 12, 13, 14]])
另外:
np.random.random.shuffle()就是random.shuffle(),用法一致
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值