DataFrame.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None, ignore_index=False)
作用:
随机抽取样本
参数介绍:
n:随机抽取的样本数,不能与 frac 一起使用。
frac:随机抽取的样本数所占的百分比。例如:抽取总样本的20%,frac=0.2。
replace:是否可对同一行进行多次采用,即有放回的采样。
weights:样本权重,自动归一化 或 以原数据的某一列为权重。
random_state:类型可为:int, array-like, BitGenerator, np.random.RandomState, optional。设定随机种子seed,如果设定了random_state,则random_state值不变每次抽样结果相同,如果不设定random_state,每次抽样直接改变。
axis:
axis=0:按行抽样;
axis=1:按列抽样;
ignore_index:如果为 True,则结果索引将标记为 0, 1, …, n - 1。
Pandas文档:sample