sample()函数🔍
-
DataFrame.sample()用于随机获取数据并返回结果,类似于random.sample()函数
-
语法👇:
DataFrame.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None)
n:可选参数,整数,定义生成的随机行数。
frac:可选参数,浮点数,并返回浮点值数据帧值的长度,不能与参数n一起使用;注意,如果frac>1,replace必须设置为True。
replace:布尔值。如果为true, 则返回带有替换的样本,替换的默认值为false。
weights:可选参数, 由类似于str或ndarray的参数组成。默认值“None”将导致相等的概率加权。
random_state:可选参数,由整数或np.random.RandomState组成。
axis:由整数或字符串值组成的可选参数。 0“行”和1“列”。
返回:与调用者相同类型的新对象, 其中包含从调用者对象中随机采样的n个项目。
- 例子🌰
>>>df=pd.DataFrame(np.arange(5*4).reshape((5,4)))
>>>df
0 1 2 3
0 0 1 2 3
1 4 5 6 7
2 8 9 10 11
3 12 13 14 15
4 16 17 18 19
>>>df.sample(n=3) #随机抽取三行
0 1 2 3
3 12 13 14 15
0 0 1 2 3
1 4 5 6 7
#frac=0.5表示随机抽取50%的数据,默认对行数据进行操作;replace=True表示有放回抽样。
>>>df.sample(frac=0.5, replace=True, random_state=1)
0 1 2 3
3 12 13 14 15
4 16 17 18 19