pandas库中groupby的相关操作
近日学习pandas时,对于其中的groupby()函数以及相关的一些操作查了一些资料,现总结一下以供后面翻阅
我觉得这个里面比较重要的还是对组对象的遍历,以及get_group()操作
准备:数据及pandas
先来导入数据
import pandas as pd
import numpy as np
df = pd.DataFrame({
'A': ['foo', 'bar', 'foo', 'bar',
'foo', 'bar', 'foo', 'foo'],
'B': ['one', 'one', 'two', 'three',
'two', 'two', 'one', 'three'],
'C': np.random.randn(8),
'D': np.random.randn(8)})
df
输出结果:
groupby()介绍
groupby()是一个主要用于分组的函数,可以用于拆分、转换、合并等等。下面根据练习时所用到的功能进行介绍
1、groupby对象属性
我们对dataframe使用groupby函数,返回的结果不再是一个dataframe,而是一个字典。并且无法直接将groupby()之后的结果显示出来,需要借助一些方法:
print(df.groupby(