PyCharm中基础加载excel文件以及对文件内数据进行增删查改

# 1.    加载数据集
data=pd.read_excel(r'ftx.xls')
print(data)
# 2.   统计 列名 为 月 的频数
print(data['月'].value_counts())
# 3. 统计不同的年下有多少个样本(频数)
print(data['年'].value_counts())
# 4.   求销售数量列的最大值和最小值
print(data['销售数量'].max())
print(data['销售数量'].min())
# 5.   按照年列数据升序,销售数量列数据降序排序
print(data.sort_values(['年','销售数量'],ascending=([True,False])))
# 6.   提取时间为2009年且销售区域为上海和沈阳的数据df1
df1=data[(data['年']==2009)&(data['销售区域'].isin(['上海','沈阳']))]
print(df1)
# 7.   对df1的数据按照销售区域进行分组,并计算各分组销售数量的均值
g1=df1.groupby('销售区域')
print(g1.agg(np.mean)['销售数量'])
# 8.   对df1的数据按照月进行分组。并计算每月销售数量的总和
g2=df1.groupby('月')
print(g2.agg(np.sum)['销售数量'])
# 9.   对数据帧df添加 季度 一列,根据 月 列进行划分
def ftx(x):
    if x==12 or x==1 or x==2:
        return '第一季度'
    elif 3<=x<6:
        return '第二季度'
    elif 6<=x<9:
        return '第三季度'
    elif 9<=x<12:
        return '第四季度'
data['季度']=data['月'].map(ftx)
print(data)
# 10.  提取时间为2009年且销售区域为上海的数据df2
df2=data[(data['年']==2009)&(data['销售区域'].isin(['上海']))]
# 11.  对df2的数据按照季度进行分组,计算每季度的销售总和
g3=df2.groupby('季度')
print(g3.agg(np.sum)['销售数量'])

#对需要数据进行分组 

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值