Pandas——groupby()

 

import pandas as pd
import numpy as np

groupby的基础操作

In [2]: df = pd.DataFrame({'A': ['a', 'b', 'a', 'c', 'a', 'c', 'b', 'c'], 
   ...:                    'B': [2, 8, 1, 4, 3, 2, 5, 9], 
   ...:                    'C': [102, 98, 107, 104, 115, 87, 92, 123]})
   ...: df
   ...: 

Out[2]: 
   A  B    C
0  a  2  102
1  b  8   98
2  a  1  107
3  c  4  104
4  a  3  115
5  c  2   87
6  b  5   92
7  c  9  123

按A列分组(groupby),获取其他列的均值

df.groupby('A').mean()

Out[3]: 
     B           C
A                 
a  2.0  108.000000
b  6.5   95.000000
c  5.0  104.666667

按多列进行分组(groupby)

df.groupby(['A','B']).mean()

Out[4]: 
       C
A B     
a 1  107
  2  102
  3  115
b 5   92
  8   98
c 2   87
  4  104
  9  123

分组后选择列进行运算

分组后,可以选取单列数据,或者多个列组成的列表(list)进行运算

In [5]: df = pd.DataFrame([[1, 1, 2], [1, 2, 3], [2, 3, 4]], columns=["A", "B", "C"])
   ...: df
   ...: 
Out[5]: 
   A  B  C
0  1  1  2
1  1  2  3
2  2  3  4
In [6]: g = df.groupby("A")
In [7]: g['B'].mean() # 仅选择B列

Out[7]: 
A
1    1.5
2    3.0
Name: B, dtype: float64
In [8]: g[['B', 'C']].mean() # 选择B、C列

Out[8]: 
     B    C
A          
1  1.5  2.5
2  3.0  4.0

可以针对不同的列选用不同的聚合方法

In [9]: g.agg({'B':'mean', 'C':'sum'})

Out[9]: 
     B  C
A        
1  1.5  5
2  3.0  4

聚合方法size()和cou

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Pandas中的groupby指令用于对数据进行分组操作。通过groupby指令,我们可以将数据按照某个或多个列的值进行分组,并对每个分组进行相应的操作。例如,我们可以对数据进行求和、计数、平均值等操作。 在使用groupby指令时,一般会结合其他的聚合函数来对每个分组进行操作。例如,可以使用sum()函数对每个分组进行求和操作,count()函数对每个分组进行计数操作,mean()函数对每个分组进行平均值操作等。 下面是一个示例代码,展示了如何使用groupby指令对数据进行分组操作,并使用sum()函数对每个分组进行求和操作: ``` import pandas as pd # 创建一个DataFrame data = pd.DataFrame({'class': \['A', 'A', 'B', 'B', 'A', 'B'\], 'score': \[90, 85, 92, 88, 95, 90\]}) # 按照'class'列进行分组,并对每个分组进行求和操作 grouped_data = data.groupby('class') sum_data = grouped_data.sum() print(sum_data) ``` 输出结果为: ``` score class A 270 B 270 ``` 这个示例中,我们首先创建了一个包含'class'和'score'两列的DataFrame。然后,我们使用groupby指令按照'class'列进行分组,并使用sum()函数对每个分组的'score'列进行求和操作。最后,我们打印出了每个分组的求和结果。 希望对你有所帮助!如果还有其他问题,请随时提问。 #### 引用[.reference_title] - *1* [123个Pandas常用基础指令,真香!](https://blog.csdn.net/weixin_42152811/article/details/119817553)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down1,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [【量化分析】对Pandas函数groupby的探讨](https://blog.csdn.net/gongdiwudu/article/details/130982828)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down1,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [Pandas常用操作命令(六)——数据分组groupby](https://blog.csdn.net/weixin_42152811/article/details/125480861)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值