pandas.DataFrame.sample 随机选取若干行
1 数据切片选取
1.1 pandas.DataFrame.sample 随机选取若干行
1.1.1 功能说明
有时候我们只需要数据集中的一部分,并不需要全部的数据。这个时候我们就要对数据集进行随机的抽样。pandas中自带有抽样的方法。
功能相似:numpy.random.choice
Generates a random sample from a given 1-D numpy array.
1.1.2 使用说明
1. 函数名及功能
DataFrame.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None)[source]
2. 输入参数说明
参数名称 | 参数说明 | 举例说明 |
n | 要抽取的行数 | df.sample(n=3,random_state=1) |
frac | 抽取行的比例 | df.sample(frac=0.8, replace=True, random_state=1) |
replace | 是否为有放回抽样, | True:取行数据后,可以重复放回后再取
|
weights | 字符索引或概率数组 axis=0:为行字符索引或概率数组 | |
random_state | int: 随机数发生器种子 | random_state=None,取得数据不重复
|
axis | 选择抽取数据的行还是列 | 也就是说axis=1时,在列中随机抽取n列,在axis=0时,在行中随机抽取n行。 |
3. 返回值说明
返回选择的N行元素的DataFrame对象。
4. 实例操作
参见文件:https://download.csdn.net/download/zhengxu25689/10958461
旃谢支持下: