pandas.DataFrame.sample
1、api
DataFrame.
sample
(self, n=None, frac=None, replace=False, weights=None, random_state=None, axis=None)
2、参数和返回值
参数:
n | 从数据中抽n个样本,不能和frac同时使用 |
frac | 从数据中抽取的比例(例如frac=0.5,就是抽一半数据),不能和n同用 |
replace | True:抽取样本不变 |
weight | 抽取样本时依靠的权重(权重越大,抽取的可能性越高) |
random_state | 用于结果的复现 |
axis | 按哪一个轴进行抽取 |
返回值:
从数据中抽出的n个样本
3、实例
>>> df
num_legs num_wings num_specimen_seen
falcon 2 2 10
dog 4 0 2
spider 8 0 1
fish 0 0 8
>>> df.sample(n=2,axis=0) #按行抽取
num_legs num_wings num_specimen_seen
dog 4 0 2
fish 0 0 8
>>> df.sample(n=2,axis=1) #按列抽取
num_wings num_legs
falcon 2 2
dog 0 4
spider 0 8
fish 0 0>>> df.sample(n=2, weights='num_specimen_seen')
num_legs num_wings num_specimen_seen
falcon 2 2 10
fish 0 0 8