pandas分组运算（groupby）

最新推荐文章于 2024-08-20 22:19:11 发布

Python 学习者

最新推荐文章于 2024-08-20 22:19:11 发布

阅读量2.1k

点赞数 3

文章标签： python

原文链接：https://www.jianshu.com/u/8f2987e2f9fb

版权

1. groupby()

import pandas as pd
df = pd.DataFrame([[1, 1, 2], [1, 2, 3], [2, 3, 4]], columns=["A", "B", "C"])
print(df)

在这里插入图片描述

g = df.groupby('A').mean()   # 按A列分组(groupby)，获取其他列的均值
print(g)

在这里插入图片描述

'''
遇到问题没人解答？小编创建了一个Python学习交流QQ群：579817333
寻找有志同道合的小伙伴，互帮互助,群里还有不错的视频学习教程和PDF电子书！
'''
# 方法1
b = df['B'].groupby(df['A']).mean()    # 按A列分组，获取B列的均值
print(b)

# 方法2
b = df.ix[:,1].groupby(df.ix[:, 0]).mean()    # 按A列分组（0对应A列，1对应B列），获取B列的均值
print(b)

# 方法3
m = df.groupby('A')
b = m['B'].mean()
print(b)

在这里插入图片描述
2. 聚合方法size()和count()

size跟count的区别： size计数时包含NaN值，而count不包含NaN值

'''
遇到问题没人解答？小编创建了一个Python学习交流QQ群：579817333
寻找有志同道合的小伙伴，互帮互助,群里还有不错的视频学习教程和PDF电子书！
'''
import pandas as pd 
import numpy as np

df = pd.DataFrame({"Name":["Alice", "Bob", "Mallory", "Mallory", "Bob" , "Mallory"],
                   "City":["Seattle", "Seattle", "Portland", "Seattle", "Seattle", "Portland"],
                   "Val":[4,3,3,np.nan,np.nan,4]})
print(df)

在这里插入图片描述

count()

a = df.groupby(["Name", "City"], as_index=False)['Val'].count()
print(a)

在这里插入图片描述
size()

'''
遇到问题没人解答？小编创建了一个Python学习交流QQ群：579817333
寻找有志同道合的小伙伴，互帮互助,群里还有不错的视频学习教程和PDF电子书！
'''
b = df.groupby(["Name", "City"])['Val'].size().reset_index(name='Size')
print(b)