python中sample()函数_PandasDataframe.sample()使用介绍

最新推荐文章于 2024-06-23 08:46:35 发布

weixin_39876514

最新推荐文章于 2024-06-23 08:46:35 发布

阅读量5.5k

点赞数 1

文章标签： python中sample()函数

本文介绍了Pandas DataFrame的sample()函数，用于从数据框中随机选取行和列。详细讲解了参数n、frac、replace、weights、random_state和axis，并通过实例演示了如何使用sample()函数抽取随机样本。

摘要由CSDN通过智能技术生成

Pandas sample()用于从DataFrame中随机选择行和列。如果要从大量数据集构建模型, 则必须随机选择通过函数样本完成的较小数据样本。

句法

DataFrame.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None)

参数

n：这是一个可选参数, 由整数值组成, 并定义生成的随机行数。

frac：它也是一个可选参数, 由浮点值组成, 并返回浮点值*数据帧值的长度。不能与参数n一起使用。

replace：由布尔值组成。如果为true, 则返回带有替换的样本。替换的默认值为false。

权重：它也是一个可选参数, 由类似于str或ndarray的参数组成。默认值”无”将导致相等的概率加权。

如果正在通过系列赛；它将与索引上的目标对象对齐。在采样对象中找不到的权重索引值将被忽略, 而在采样对象中没有权重的索引值将被分配零权重。

如果在轴= 0时正在传递DataFrame, 则返回0。它将接受列的名称。

如果权重是系列；然后, 权重必须与被采样轴的长度相同。

如果权重不等于1；它将被标准化为1的总和。

权重列中的缺失值被视为零。

权重栏中不允许无穷大。

random_state：它也是一个可选参数, 由整数或numpy.random.RandomState组成。如果值为int, 则为随机数生成器或numpy RandomState对象设置种子。

axis：它也是由整数或字符串值组成的可选参数。 0或”行”和1或”列”。

Return

它返回与调用者相同类型的新对象, 其中包含从调用者对象中随机采样的n

最低0.47元/天解锁文章

weixin_39876514

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
python中sample()函数_PandasDataframe.sample()使用介绍

Pandas sample()用于从DataFrame中随机选择行和列。如果要从大量数据集构建模型, 则必须随机选择通过函数样本完成的较小数据样本。句法DataFrame.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None)参数n：这是一个可选参数, 由整数值组成, 并定义生成的随机...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。