约定:
import pandas as pd
import numpy as np
GroupBy分组
对数据进行分组并对每个分组进行运算是数据分析中很重要的环节。该博客讲解了利用pandas的Groupby技术如何进行分组。下图简单介绍了分组的过程:
创建DataFrame对象
df1=pd.DataFrame({'Data1':np.random.randint(0,10,5),'Data2':np.random.randint(10,20,5),'key1':list('aabba'),'key2':list('xyyxy')})
df1
代码结果:
Data1
Data2
key1
key2
0
5
15
a
x
1
2
15
a
y
2
6
17
b
y
3
9
16
b
x
4
9
13
a
y
分组特性和查看分组后的大小
.groupby()返