pandas中关于DataFrame的groupby方法，如何取出分组的ID(行名称)和ID对应的个数

最新推荐文章于 2025-03-10 17:18:34 发布

Week.D.Awn

最新推荐文章于 2025-03-10 17:18:34 发布

阅读量3.6w

点赞数 11

CC 4.0 BY-SA版权

分类专栏：数据分析文章标签： groupby 拆分分组数量

本文链接：https://blog.csdn.net/weekdawn/article/details/81391159

数据分析专栏收录该内容

9 篇文章

订阅专栏

本文介绍了 Pandas 中 groupby 函数的使用方法，并通过示例展示了如何分组数据、获取分组数量及进行迭代等操作。此外还提供了 max、min 和 sum 等聚合函数的使用技巧。

groupby的函数定义：

DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False, **kwargs)[source]

有关于groupby的拆分问题实在难找，经过多次测试，终于得到很好的解决办法。见示例代码：

#按A列进行分组，得到分组后的（没有重复行）groupby对象
df_gp = df.groupby("A")

#得到分组的总长度
lenth = len(df_gp.count())

#得到分组后的ID(行名称)
id_name = df_gp.size().values

#得到分组后ID(行名称)对应的数量
id_num = df_gp.size().index

补充一些其他可能会用到的方法：
max(), min(), sum()

groupby也是可以进行迭代的：

for i,j in df_gp:
	print(i,j)

还可以通过get_group()方法取出对应的组！

#取出行id为"WEEKDAWN"的组
df_gp.get_group("WEEKDAWN")

关注博主即可阅读全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Week.D.Awn

关注关注

11
点赞
踩
46

收藏

觉得还不错? 一键收藏
8
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

pandas使用groupby函数计算dataframe每个分组对应的数据行的个数（size of each group in dataframe, rows count of group）

data+scenario+science+insight

03-24

1770

pandas使用groupby函数计算dataframe每个分组对应的数据行的个数（size of each group in dataframe, rows count of group）

使用pandas中的groupby函数计算数据框每个分组对应的数据行数可以让我们更好地了解数据的分布情况，为数据分析和统计提供基础信息。在python中，使用p...

与其临渊羡鱼,不如退而结网

05-29

439

使用pandas中的groupby函数计算数据框每个分组对应的数据行数可以让我们更好地了解数据的分布情况，为数据分析和统计提供基础信息。下面将介绍如何使用groupby函数计算dataframe每个分组对应的数据行的个数，并提供相应的源代码。在该代码中，我们首先根据Gender列对数据进行了分组，然后使用size函数计算每个分组对应的数据行数，最后通过reset_index函数将结果转化为一个新的数据框，并命名为Count。接着，我们可以使用groupby函数对数据进行分组，并计算每个分组对应的数据行数。

8 条评论您还未登录，请先登录后发表或查看评论

pandas使用groupby函数基于指定分组变量对dataframe数据进行分组、len函数和nunique函数计算分组的个数（分组包含多个dataframe）

data+scenario+science+insight

08-27

448

pandas使用groupby函数基于指定分组变量对dataframe数据进行分组、len函数和nunique函数计算分组的个数（分组包含多个dataframe）

dataframe groupby_python pandas获取groupby之后的数据

weixin_39762838的博客

11-22

1672

python pandas获取groupby之后的数据mp.weixin.qq.com上周，有个网友在后台提问，如何获取groupby之后的数据。后来，在网上还真找到了一种解决方法，虽然有点麻烦，但确实实现了。在这里小记录一下，供大家参考：>>> import pandas as pd # 原始数据 >>> df = pd.read_excel(r'D:/my...

Python的pandas的Dataframe使用groupby分组并求每组的统计值

dugushangliang的博客

12-05

9601

版权声明：转载请注明作者（独孤尚良dugushangliang）出处： import pandas as pd import numpy as np df = pd.DataFrame(np.random.randn(6, 4), index=list(range(6)), columns=list('abcd')) df['d']=[1,2,2,1,1,2] #这是依照d列为分组，d列中相同值的被分到一组 df2=df.groupby(df['d']) 此时的df2是一个pandas...

【第7章Pandas实战案例与解析分组聚合】7.408 深入Pandas：使用groupby()分组并统计各组的个数

03-10

928

自定义列名print("\n自定义列名后的结果：")

pandas使用groupby函数和agg函数获取每个分组特定变量独特值的个数（number of distinct values in each group in dataframe）

data+scenario+science+insight

02-26

4449

pandas使用groupby函数和agg函数获取每个分组特定变量独特值的个数（number of distinct values in each group in dataframe）

python dataframe group by_Python DataFrame.groupby()聚合函数,分组级运算

weixin_40003780的博客

12-08

1280

pandas提供了一个灵活高效的groupby功能，它使你能以一种自然的方式对数据集进行切片、切块、摘要等操作。根据一个或多个键(可以是函数、数组或DataFrame列名)拆分pandas对象。计算分组摘要统计，如计数、平均值、标准差，或用户自定义函数。对DataFrame的列应用各种各样的函数。应用组内转换或其他运算，如规格化、线性回归、排名或选取子集等。计算透视表或交叉表。执行分位数分析以及其...

pandas使用goupby函数和nunique函数计算每个分组对应的多个变量的独特值的个数（ unique values of each group in dataframe）

data+scenario+science+insight

02-13

778

pandas使用goupby函数和nunique函数计算每个分组对应的多个变量的独特值的个数（ unique values of each group in dataframe）

Pandas groupby分组后求各组行数

三妹的博客

04-29

9122

一、需求 CSV 文件中，按 ‘date’列分组，求分组后各个分组的行数。二、代码 import pandas as pd data = pd.read_csv('test.csv') df = pd.DataFramd(data) df = df.groupby('date').size() # 统计各个分组行数 _list = df.to_list() print('_li...

16_Pandas.DataFrame计算统计信息并按GroupBy分组

qq_18351157的博客

05-14

7494

16_Pandas.DataFrame计算统计信息并按GroupBy分组可以通过andas.DataFrame和pandas.Series的groupby（）方法对数据进行分组。可以汇总每个组的数据，并且可以通过任何函数计算或处理统计信息，例如平均值，最小值，最大值和总计。这里，将描述以下内容。 iris数据集通过groupby()分组计算平均值，最小值，最大值，总和等通过应用任意处理进行聚合：agg（）批量统计关键统计信息：describe（）绘制图表 iris数据集以iris数据集为

【python-pandas】python pandas获取groupby之后的数据

小苏打的学习博客

05-24

3764

python pandas获取groupby之后的数据 >>> import pandas as pd # 原始数据 >>> df = pd.read_excel(r'D:/myExcel/1.xlsx') >>> df name math 0 bog 45 1 jiken 67 2 bob 23 3 jiken 34 # groupby之后的数据 >>> dh = df.groupby

DataFrame的groupby()函数

jingshuiliushen_zj的博客

10-20

1万+

groupby()是一个分组函数，对数据进行分组操作的过程可以概括为：split-apply-combine三步： 1.按照键值（key）或者分组变量将数据分组。 2.对于每组应用我们的函数，这一步非常灵活，可以是python自带函数，可以是我们自己编写的函数。 3.将函数计算后的结果聚合。举例： df = pd.DataFrame({'key1':list('aabba'), ...

python中的Dataframe中用groupby后如何得到每组的行数（或者叫每组的大小）

skj1995的博客

11-05

9082

我之前的数据myDF是这样的：这只是其中的一部分现在我想根据车的ID对数据进行分类，然后得到每种车的记录数，可以进行如下操作： myDF=myDF.groupby(myDF["车的ID"]).agg("count") 得到的结果如下：可以看到每一行里面除了车的ID和车的方向这一列，其余列的值都一样。车的方向这一列跟其他列的计数不一样是因为原数据中这一列有的值为NaN。因此...

dataframe groupby_python pandas对groupby之后的数据的几个小技巧

weixin_39634237的博客

11-27

1025

python pandas对groupby之后的数据的几个小技巧mp.weixin.qq.com这几个小技巧能够帮助我们在对dataFrame作groupby之后，快速的浏览数据的大致情况。举例如下：>>> import pandas as pd >>> import numpy as np >>> df = pd.read_excel(r...

Pandas系列(十二)实现groupby分组统计

小小何先生的学习之旅

08-15

1万+

groupby首先按照key进行分组，就可以得到每个groupby的名称，以及group本身，而group本身是一个dataframe或者一个series，然后在这个dataframe或者series进行统计。统计完成之后会将key和统计结果拼合起来。获取数据分组使用聚合函数做数据统计单个列groupby，查询所有数据列的统计将属性A进行分组，之后再对其属性求和：这里要注意两点： groupby中的’A’变成了数据的索引列因为要统计sum，但B列不是数字，所以被自动忽略掉 ...

Pandas-groupby

qq_53311560的博客

10-28

435

PANDAS的分组groupby讲解 groupbyPANDAS的分组groupby讲解分布代码演示及结果完整代码展示分布代码演示及结果 import pandas as pd import numpy as np df=pd.DataFrame({ 'user':['小明','小李','小赵','小何'] 'gender':['男','女','男','女'], 'score':[99,95,70,88] },index=['1','2','3','4']) print(df)

Python Pandas DataFrame value_counts() 函数统计属性取值的个数

最新发布

03-26

<think>好的，用户想知道如何在Pandas中实现类似SQL的GROUP BY然后计算每组的数量。我需要一步步解释清楚，同时确保回答结构清晰。首先，用户可能熟悉SQL中的GROUP BY和COUNT()，所以应该先建立两者之间的对应关系。Pandas中的groupby方法应该和SQL的GROUP BY类似，然后需要计算每组的行数，这对应到Pandas可能是size()或者count()方法。接下来，我需要区分size和count的不同，避免用户混淆。size会计算所有行，包括NaN值，而count会排除NaN。这时候需要举例说明，比如创建一个示例DataFrame，包含可能有缺失值的数据，展示两者的区别。然后，用户可能需要具体的代码示例，所以应该给出一个简单的DataFrame，比如包含'Category'和'Value'两列的数据，然后演示groupby之后使用size()和count()的不同结果。同时，提醒用户根据需求选择合适的方法。另外，用户可能希望结果像SQL那样有明确的列名，可以提到使用reset_index()来将结果转换为DataFrame，并重命名列名，使其更直观。还要考虑用户是否有其他聚合函数的需求，比如sum、mean等，可以简要提及，但重点放在count上。最后，总结一下步骤，帮助用户理清思路。需要确保回答准确，语法正确，使用中文，并且避免使用Markdown格式。同时，按照系统指令，行内公式用$...$，独立公式用$$...$$，不过这个问题可能不太涉及数学公式，所以可能不需要。但如果有涉及到，比如举例数学表达式时，要注意格式。检查是否遗漏了重要点，比如groupby后的对象处理，或者是否需要聚合其他统计量。确保用户能明白每一步的操作和结果。可能还需要提到agg()函数，用更灵活的方式聚合，比如同时计算多个统计量。最后，保持回答简洁明了，逐步引导用户完成操作，确保他们能够理解并应用在自己的代码中。</think>在 Pandas 中实现类似 SQL 的 `GROUP BY + COUNT` 功能，可以通过以下步骤完成： --- ### 一、核心方法：`groupby()` + `size()`/`count()` ```python import pandas as pd # 示例数据 df = pd.DataFrame({ 'Category': ['A', 'B', 'A', 'C', 'B', 'A', 'C'], 'Value': [10, 20, 30, 40, 50, 60, 70] }) # 按 Category 分组并计算每组的行数 grouped_size = df.groupby('Category').size() # 计算所有行（包括空值） grouped_count = df.groupby('Category').count() # 计算非空值数量 ``` --- ### 二、结果对比 1. **`size()` 方法** 直接统计每组的**总行数**（不排除空值）： ``` Category A 3 B 2 C 2 dtype: int64 ``` 2. **`count()` 方法** 统计每组中**非空值的数量**（按列统计）： ``` Value Category A 3 B 2 C 2 ``` --- ### 三、重命名结果列（类似 SQL 别名） ```python # 使用 reset_index() 转换为 DataFrame 并重命名 result = df.groupby('Category').size().reset_index(name='Count') ``` 输出结果： ``` Category Count 0 A 3 1 B 2 2 C 2 ``` --- ### 四、扩展：多列分组统计 ```python # 按多列分组统计 multi_group = df.groupby(['Category', 'Value']).size().reset_index(name='Count') ``` --- ### 五、对比 SQL 语法假设原 SQL 为： ```sql SELECT Category, COUNT(*) AS Count FROM table GROUP BY Category; ``` Pandas 等效操作： ```python df.groupby('Category').size().reset_index(name='Count') ``` --- ### 关键区别说明 | 方法 | 包含空值 | 输出类型 | 适用场景 | |----------|----------|---------------|-------------------| | `size()` | 是 | Series | 需要统计所有行数 | | `count()`| 否 | DataFrame | 需要统计非空值数量 | 根据实际需求选择方法，通常统计分组行数时 `size()` 更直接。