16.Pandas实现groupBy分组统计

最新推荐文章于 2023-06-12 15:34:14 发布

CSDN专家-微编程

最新推荐文章于 2023-06-12 15:34:14 发布

阅读量729

点赞数

分类专栏： Pandas专栏文章标签： pandas python 数据分析

本文链接：https://blog.csdn.net/technologist_28/article/details/126348409

版权

Pandas专栏专栏收录该内容

18 篇文章 2 订阅

订阅专栏

简单介绍

类似Sql:
select city,max(temperature) from city_weather group by city;
groupby:先对数据分组，然后在每个分组上应用聚合函数，转换函数
本次演示

分组使用聚合函数做数据统计
遍历groupby的结果理解执行流程
实例分组探索天气数据

import pandas as pd
import numpy as np

df = pd.DataFrame({
    'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
    'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],
    'C': np.random.randn(8),
    'D': np.random.randn(8)
})
print(df)

在这里插入图片描述

分组使用聚合函数做数据统计

1.单个列groupby，查询所有列的统计

# 1.groupby中A变成了数据的索引列
# 2.因为要统计sum,但B列不是数字，所以被自动忽略掉
print(df.groupby('A').sum())

在这里插入图片描述

2.多个列groupby,查询所有数据列的统计

# (A,B)成对变成了二级索引
print(df.groupby(['A', 'B']).mean())
print("*" * 32)
print(df.groupby(['A', 'B'], as_index=False).mean())

在这里插入图片描述

3.同时查看多种数据统计

在这里插入图片描述

4.查看单列的结果数据统计

在这里插入图片描述

5.不同列使用不同的聚合函数

在这里插入图片描述

遍历groupby的结果理解执行流程

在这里插入图片描述

实例分组探索天气数据

数据整理

import pandas as pd
fpath = "../data/tianqi.csv"
df = pd.read_csv(fpath)
# 替换掉温度的后缀
df.loc[:, "bWenDu"] = df["bWenDu"].str.replace("°C", "").astype('int32')
df.loc[:, "yWenDu"] = df["yWenDu"].str.replace("°C", "").astype('int32')
print(df.head())

在这里插入图片描述

# 新增一列为月份
df['mouth'] = df['ymd'].str[:7]
print(df.head())

在这里插入图片描述

查看每个月的最高温度

data = df.groupby('mouth')['bWenDu'].max()
print(data)
type(data)
print(type(df.groupby('mouth')))

在这里插入图片描述

查看每个月的最高温度、最低温度、平均空气质量指数

group_data = df.groupby('mouth').agg({"bWenDu": np.max, "yWenDu": np.min, "aqi": np.mean})
print(group_data)

在这里插入图片描述

CSDN专家-微编程

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
16.Pandas实现groupBy分组统计

类似Sql:groupby:先对数据分组，然后在每个分组上应用聚合函数，转换函数本次演示分组使用聚合函数做数据统计遍历groupby的结果理解执行流程实例分组探索天气数据。
复制链接

扫一扫

专栏目录