上周,有个网友在后台提问,如何获取groupby之后的数据。后来,在网上还真找到了一种解决方法,虽然有点麻烦,但确实实现了。在这里小记录一下,供大家参考:
>>> import pandas as pd
# 原始数据
>>> df = pd.read_excel(r'D:/myExcel/1.xlsx')
>>> df
name math
0 bog 45
1 jiken 67
2 bob 23
3 jiken 34
# groupby之后的数据
>>> dh = df.groupby(['name'])
# 打印之后发现是个对象
>>> dh
<pandas.core.groupby.generic.DataFrameGroupBy object at 0x000002B675618F70>
# 通过勋魂调用发现内部保存了字典形式。key值是groupby列的值,
# value是该值所代表的结果,以dateFrame格式保存
>>> for key,value in dh:
print(key)
print(value)
bob
name math
2 bob 23
bog
name math
0 bog 45
jiken
name math
1 jiken 67
3 jiken 34
# 新建一个dataFrame,列名与df保持一致。通过
# 迭代进行行连接。得到结果
>>> ds = pd.DataFrame(columns=df.columns)
>>> for key, value in dh:
ds = pd.concat([ds, value])
# 哈哈,这样就得到groupby的结果
>>> ds
name math
2 bob 23
0 bog 45
1 jiken 67
3 jiken 34
哈哈,以上就是python小工具关于如何获取groupby之后的数据的介绍,其实也并不是多麻烦。增加了两三行代码而已。欢迎关注微信公众号:python小工具,一起学习python和pandas。