PandasDataframe.sample()使用介绍

Pandas的sample()函数用于从DataFrame中随机抽取行或列。参数包括n(指定随机行数)、frac(按比例抽取)、replace(是否允许替换)、weights(权重分布)和random_state(随机数种子)。示例代码演示了如何从CSV文件加载数据并抽取随机行。
摘要由CSDN通过智能技术生成

Pandas sample()用于从DataFrame中随机选择行和列。

DataFrame.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None)

 参数

  • n:这是一个可选参数, 由整数值组成, 并定义生成的随机行数。
  • frac:它也是一个可选参数, 由浮点值组成, 并返回浮点值*数据帧值的长度。不能与参数n一起使用。
  • replace:由布尔值组成。如果为true, 则返回带有替换的样本。替换的默认值为false。
  • 权重:它也是一个可选参数, 由类似于str或ndarray的参数组成。默认值”无”将导致相等的概率加权。
    如果正在通过系列赛;它将与索引上的目标对象对齐。在采样对象中找不到的权重索引值将被忽略, 而在采样对象中没有权重的索引值将被分配零权重。
    如果在轴= 0时正在传递DataFrame, 则返回0。它将接受列的名称。
    如果权重是系列;然后, 权重必须与被采样轴的长度相同。
    如果权重不等于1;它将被标准化为1的总和。
    权重列中的缺失值被视为零。
    权重栏中不允许无穷大。
  • random_state:它也是一个可选参数, 由整数或numpy.random.RandomState组成。如果值为int, 则为随机数生成器或numpy RandomState对象设置种子。
  • axis:它也是由整数或字符串值组成的可选参数。 0或”行”和1或”列”。

Return

它返回与调用者相同类型的新对象, 其中包含从调用者对象中随机采样的n个项目。

例子1:


                
  • 12
    点赞
  • 39
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值