分组
groupby
方法是pandas中的分组方法,对数据框采用groupby
方法后,返回的是DataFrameGroupBy
对象,一般分组操作后会进行聚合操作。
import pandas as pd
import numpy as np
df = pd.DataFrame({'A': [1, 1, 2, 2],'B': [1, 2, 3, 4],'C':[6,8,1,9]})
对数据框按A
列进行分组,产生分组数据框。分组数据框是可迭代对象,可以进行循环遍历,可以看出在循环中,每个元素的类型是元组,
元组的第一个元素是分组值,第二个元素是对应的分组数据框。
分组
g_df=df.groupby('A')
分组数据框类
type(g_df)
循环分组数据
for i in g_df: print(i,type(i),end='\n\n')
可以对分组后的数据框直接使用聚合方法agg
,对分组数据框的每一列计算统计函数值。
分组求和
df.groupby('A').agg('sum')
一、序列分组
可以根据数据框外的序列数据对数据框进行分组,需要注意序列长度需要与数据框行数相同。
label=['a','a','b','b']
df