pandas.sample(frac=)
sample(frac=0.5), # 随机取data的一半数据
sample(frac=1.0), # 随机取data的所有数据,相当于打乱顺序
import pandas as pd
data = pd.DataFrame()
data['text'] = ['x1','x2','x3','xx']
data['label'] = ['花','草','树','木']
print(data)
'''
text label
0 x1 花
1 x2 草
2 x3 树
3 xx 木
'''
print(data.sample(frac=0.5)) # 随机取data的一半数据
'''
text label
2 x3 树
1 x2 草
'''
print(data.sample(frac=1.0)) # 随机取data的所有数据,相当于打乱顺序
'''
text label
2 x3 树
3 xx 木
1 x2 草
0 x1 花
'''
np.random.seed(2020) # 固定随机种子,使得每次运行可以复现