pandas笔记：groupby整理

UQI-LIUWJ

已于 2024-01-15 13:53:05 修改

阅读量260

点赞数

文章标签： pandas 笔记

于 2023-07-24 16:39:13 首次发布

本文链接：https://blog.csdn.net/qq_40206371/article/details/131888998

版权

0 数据集

# Visual Python: Data Analysis > File
vp_df = pd.read_csv('https://raw.githubusercontent.com/visualpython/visualpython/main/visualpython/data/sample_csv/fish.csv')
vp_df

1　单列聚合

vp_df.groupby('Type')['Kg'].mean()
'''
Type
mackerel     1.417456
salmon       5.996645
tuna        18.038317
Name: Kg, dtype: float64
'''

按照Type 聚类，聚类后将同组的Kg属性合并，求均值

聚合的内容可以是 max, min, mean, unique（唯一值）, nunique（唯一值数量），lambda 表达式

1.1 单列聚合多个操作

vp_df.groupby('Type')[['Kg']].agg(['mean','max'])

1.2 单列聚合多个属性

vp_df.groupby('Type')[['Kg','Depth']].mean()

按照Type 聚类，聚类后将同组的Kg、Depth属性合并，求均值

1.3 单列聚合多个属性多个操作

vp_df.groupby('Type')[['Kg','Depth']].agg(['mean','max'])

1.4 多列聚合

vp_df.groupby(['Type','Depth']).agg(mean_kg=('Kg','mean'),
                         max_depth=('Depth','max'))

2 对聚合结果重命名

重命名的名字=（需要操作的列名，需要的操作名）

vp_df.groupby('Type').agg(mean_kg=('Kg','mean'),
                         max_depth=('Depth','max'))

3 生成了多少个组 ngroups

vp_df.groupby(['Type','Depth']).ngroups
#1500

4 每一个不同的group 各有多少个元素

vp_df.groupby(['Type']).count()

4.1 使用reset_index

data.groupby(['LONCOL', 'LATCOL'])['VehicleNum'].count()
'''
LONCOL  LATCOL
36      63        3
        64        2
        65        1
        66        1
        67        8
                 ..
182     44        1
183     44        2
184     44        1
185     44        2
186     43        5
Name: VehicleNum, Length: 3382, dtype: int64
'''

data.groupby(['LONCOL', 'LATCOL'])['VehicleNum'].count().reset_index()

参考内容：Python数据分组处理必备：pandas groupby (qq.com)

UQI-LIUWJ

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫