# 1. 加载数据集 data=pd.read_excel(r'ftx.xls') print(data) # 2. 统计 列名 为 月 的频数 print(data['月'].value_counts()) # 3. 统计不同的年下有多少个样本(频数) print(data['年'].value_counts()) # 4. 求销售数量列的最大值和最小值 print(data['销售数量'].max()) print(data['销售数量'].min()) # 5. 按照年列数据升序,销售数量列数据降序排序 print(data.sort_values(['年','销售数量'],ascending=([True,False]))) # 6. 提取时间为2009年且销售区域为上海和沈阳的数据df1 df1=data[(data['年']==2009)&(data['销售区域'].isin(['上海','沈阳']))] print(df1) # 7. 对df1的数据按照销售区域进行分组,并计算各分组销售数量的均值 g1=df1.groupby('销售区域') print(g1.agg(np.mean)['销售数量']) # 8. 对df1的数据按照月进行分组。并计算每月销售数量的总和 g2=df1.groupby('月') print(g2.agg(np.sum)['销售数量']) # 9. 对数据帧df添加 季度 一列,根据 月 列进行划分 def ftx(x): if x==12 or x==1 or x==2: return '第一季度' elif 3<=x<6: return '第二季度' elif 6<=x<9: return '第三季度' elif 9<=x<12: return '第四季度' data['季度']=data['月'].map(ftx) print(data) # 10. 提取时间为2009年且销售区域为上海的数据df2 df2=data[(data['年']==2009)&(data['销售区域'].isin(['上海']))] # 11. 对df2的数据按照季度进行分组,计算每季度的销售总和 g3=df2.groupby('季度') print(g3.agg(np.sum)['销售数量'])
#对需要数据进行分组