目前用到啥,整理啥
随机打乱样本数据
linux
pandas
'''frac指的是返回的样本,如果需要30%的数据,那么可以设置参数为0.3'''
df.sample(frac=1).reset_index(drop=True)
另外sklearn中有专门包
from sklearn.utils import shuffle
df = shuffle(df)
随机生成无重复数据
'''list中取出5个样本'''
import random
list = []
sap = random.sample(list, 5)