Python pandas库中groupby()将列表作为分组键的用法解析
GroupBy:对标签或索引的局部进行累计分析
groupby常用列名分割DataFrame,我们可以用 DataFrame 的groupby()方法进行绝大多数常见的分割 - 应用 - 组合操作,将需要分组的列名传进去即可:
df = pd.DataFrame({'key': ['A', 'B', 'C', 'A', 'B', 'C'],
'data': range(6)}, columns=['key', 'data']
print(df.groupby('key').sum())
设置分割的键
groupby()还可以将列表、数组、Series 或索引作为分组键。分组键可以是长度与 DataFrame 匹配的任意 Series 或列表,例如:
定义如下DataFrame:
rng = np.random.RandomState(0)
df = pd.DataFrame({'key': ['A', 'B', 'C', 'A', 'B', 'C'],
'data1': range(6),
'data2': rng.randint(0, 10, 6)},
columns = ['key', 'data1', 'data2'])
L = [0, 1, 0, 1, 2, 0]
print(df.groupby(L).sum())
因为列表的长度与DataFrame中的行数相同,这意味着:
计算流程如上图所示,结果将以列表L对应的元素作为索引对data1和data2进行分组求和。