学用pandas中的DataFrame
(二)学习DataFrame中的groupby()及函数sum的用法
大家都知道,利用dataframe能够快速处理数据,但我没有看到详细的介绍,在网上搜,也没有找到,就简单摸索了一下。
#-- coding:utf-8 --
import pandas as pd
excelFile = r’C:\Users\baijb2\Desktop\外电\零星需求\零星需求材料统计.xlsx’
df = pd.DataFrame(pd.read_excel(excelFile,sheet_name=3))
print(df)
df2=df.groupby(‘单位’).sum()
df2.to_excel(“33.xlsx”)
这样,所有的数值,都通过分组求和,得到了结果,但许多是我不需要的。
那么应该是什么样的
df2=df.groupby(‘单位’)[‘金额’].sum()
这里,单位,金额都是一列列名
那么,如果根据多条件分组呢
df.groupby([‘单位’,‘金额’])
(三)利用列表生成DATAFRAME
df = pd.DataFrame(data=list_value,index=list_name,columns=[‘销售金额’])