python随机分组的方法_Python Pandas从Groupby中选择组的随机样本

最新推荐文章于 2021-11-22 20:40:49 发布

weixin_39658966

最新推荐文章于 2021-11-22 20:40:49 发布

阅读量1.2k

点赞数

文章标签： python随机分组的方法

您可以获取df.some_key.unique()的唯一值的randoms示例,使用它来对df进行切片,最后对结果进行groupby：

In [337]:

df = pd.DataFrame({'some_key': [0,1,2,3,0,1,2,3,0,1,2,3],

'val': [1,2,3,4,1,5,1,5,1,6,7,8]})

In [338]:

print df[df.some_key.isin(random.sample(df.some_key.unique(),2))].groupby('some_key').mean()

val

some_key

0 1.000000

2 3.666667

如果有多个groupby键：

In [358]:

df = pd.DataFrame({'some_key1':[0,1,2,3,0,1,2,3,0,1,2,3],

'some_key2':[0,0,0,0,1,1,1,1,2,2,2,2],

'val': [1,2,3,4,1,5,1,5,1,6,7,8]})

In [359]:

gby = df.groupby(['some_key1', 'some_key2'])

In [360]:

print gby.mean().ix[random.sample(gby.indices.keys(),2)]

val

some_key1 some_key2

1 1 5

3 2 8

但是如果你只想获得每个组的值,你甚至不需要麻烦,MultiIndex会做：

In [372]:

idx = random.sample(set(pd.MultiIndex.from_product((df.some_key1, df.some_key2)).tolist()),

print df.set_index(['some_key1', 'some_key2']).ix[idx]

val

some_key1 some_key2

2 0 3

3 1 5

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39658966

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python随机分组的方法_Python Pandas从Groupby中选择组的随机样本

您可以获取df.some_key.unique()的唯一值的randoms示例,使用它来对df进行切片,最后对结果进行groupby：In [337]:df = pd.DataFrame({'some_key': [0,1,2,3,0,1,2,3,0,1,2,3],'val': [1,2,3,4,1,5,1,5,1,6,7,8]})In [338]:print df[df.some_ke...
复制链接

扫一扫

Python|random之随机抽人分组

算法与编程之美

01-06

5341

本文首发于微信公众号："算法与编程之美"，欢迎关注，及时了解更多此系列文章。引言random库让Python语言有了灵魂，random是python函数中非常实用的函数之...

python随机分组的思路_一个关于随机分组需求的Python方案与思考

weixin_33516557的博客

02-11

1674

需求描述：这是一个实际生活中遇到的需求，一共有8个人需要在一周的5个工作日值班，每天都需要5个人完成值班任务，其中有一个人是个组长。要求组长在这5天里一共值班4次，其他人员均值班3次，每天的5个值班人员是8个人中的5人随机组合。分析：乍一看，好像有点无从下手，咱们细细分析就可以这样考虑，我们假设每个人都有分身术，组长一共有4个分身，其他人均有3个分身，这时正好25个人，组合后正好可以满足5天(25...

参与评论您还未登录，请先登录后发表或查看评论

python随机分组的思路_python – 对对象进行分组以实现所有组的类似平均属性

weixin_39977886的博客

11-28

263

您可以尝试使用k-means clustering：import scipy.cluster.vq as vqimport collectionsimport numpy as npdef auto_cluster(data,threshold=0.1,k=1):# There are more sophisticated ways of determining k# See http://en....

python随机分组的方法_Python实用黑科技——以某个字段进行分组

weixin_39588084的博客

12-08

1055

需求：当前有个字典实例，你想以某个字段比如”日期”对整个字典里面的元素进行分组。方法：itertools.groupby()函数是专门用来干这个活的。请看下面这个例子，这里有一个列表构成的字典，你想按照日期来对列表进行分组，可以这么做：In [42]: from operator import itemgetterIn [43]: from itertools import groupbyIn [...

一个关于随机分组需求的Python方案与思考

[ta叫我小白]的专栏

02-22

1756

pandas-groupby-filter：适用于pandas groupby过滤器的手册

02-15

熊猫分组过滤器Playbook for pandas groupby过滤器。熊猫数据框使用.groupby（）对象进行简化计算。例如，给定金融期权数据的数据框，其中股票代码的栏目为“ UnderlyingSymbol”，而溢价要价的栏目为“ Ask”。...

data_analysis_with_pandas：使用Python3Pandas 1.0.3的示例中最常见的操作（Jupyter Notebook）

02-18

`groupby()`函数可以基于一个或多个列将数据分组，然后对每个组应用聚合函数（如`sum()`, `mean()`, `count()`等）。此外，`pivot_table()`可以创建交叉表，用于多维度的汇总。最后，数据透视和重塑是数据分析的...

利用Python进行数据分析——数据聚合与组操作

01-27

本文主要探讨如何利用Python进行数据处理，尤其是使用Pandas库中的`groupby()`函数。`groupby()`是Pandas的一个核心功能，用于对数据集进行分组，以便进行聚合操作。 **1. GroupBy机制** 当你对数据集按照特定的键...

数据分析中python主要涉及哪些函数和经典算法.docx

05-19

- **数据聚合**：如`df.groupby()`用于按一个或多个列对数据进行分组并应用聚合函数，这对于汇总分析非常重要。 ##### Matplotlib Matplotlib是一个用于绘制高质量图表的数据可视化库。它的关键功能包括： - **...

test_python_数理统计_源码.zip

10-25

例如，你可以使用`df.describe()`获取数据集的基本统计信息，或用`df.groupby()`进行分组分析。再者，SciPy库扩展了NumPy的功能，提供了更复杂的统计方法，如t检验、卡方检验、回归分析等。例如，`scipy.stats....

Python编写的随机分组小程序

03-18

输入总人数N和分组数n，即可进行随机分组（如果N不是n的整数倍，则n个小组中的人数会不相同）

学生随机分班的python实现

08-21

目前各地学校都被要求阳光分班，也就是公平公正的为学生安排班级，但是从实现上，好多是教务员手工复制、粘贴完成的，本文作者系教师，较为了解一线教师的辛苦，这里呈现一种python语言的实现，前几日发给一位工作在小学的好友使用。代码中实现了每个班人数最多与最少只能差1，保证每个班人数基本均衡。缺点：没有考虑性别的均衡。

随机分组（菜鸟程序）

08-05

在输入需要分组的人时一定要用,隔开才可以实现切忌

python 地税局自动分组随机选案软件.zip

03-19

齐齐哈尔地税局需要一个自动分组随机选案软件，要求：全市有1W多家企事业单位，需要随机核查；地税局有20人，包括3名科长，15名科员。要求随机分组，不能人指定核查单位。比如本次核查要求分3组，每组4人，科长不能在一组；分好小组，从1W多家企事业单位中每组随机抽查5家核查；

python随机分组的方法_Python几种分组计数方法比较

weixin_39933484的博客

12-08

1560

在数据清洗的过程中，常常会用到分组计数，当数据量很大的时候，需要考虑运行速度。Python中有多种方式可以实现分组计数，本文汇总了搜集到的几种方法，并对它们的运行速度做了测试。首先，生成一个长度为1000万的随机字符串列表，并引入时间模块计算运行时长：import randomimport stringimport timen = 10000000ran_str = [None]*nfor i i...

python 随机分组