DataFrame、Series练习题——租房数据预处理


To 大数据的友友 :代码慢慢堆 ~ 终究会起飞 ~ Except Ctrl+V ~ Salute!


从字典dict构建Series

描述

从字典dict构建Series参考输出示例输出。输出如下

a    9
b    8
c    7
d    6
dtype: int64
<class 'pandas.core.series.Series'>

代码及运行结果

import pandas as pd
d = {
   "a":9,"b":8,"c":7,"d":6}
a_Series = pd.Series(d)
print(a_Series)
print(type(a_Series))
a    9
b    8
c    7
d    6
dtype: int64
<class 'pandas.core.series.Series'>

进程已结束,退出代码为 0

用pandas和numpy分析药店的营业数据

以下是某连锁药店销售数据,请使用numpy、pandas相关做分析。要求如下:‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬

序号 药名 销量 价格 分店
1 双黄连口服液 89 20 四季青分店
2 莲花清瘟胶囊 45 21 四季青分店
3 藿香正气水 55 10 四季青分店
4 大山楂丸 66 15 四季青分店
5 感冒清热颗粒 13 25 四季青分店
6 六君子胶囊 39 40 四季青分店
7 生脉饮 10 29 四季青分店
8 红霉素软膏 56 5 四季青分店
9 西洋参含片 19 300 四季青分店
10 清开灵口服液 99 32 四季青分店
11 十全大补胶囊 89 55 四季青分店
12 四物颗粒 45 45 四季青分店
13 双黄连口服液 30 20 金源分店
14 莲花清瘟胶囊 21 21 金源分店
15 藿香正气水 55 10 金源分店
16 大山楂丸 66 15 金源分店
17 感冒清热颗粒 13 25 金源分店
18 六君子胶囊 39 40 金源分店
19 生脉饮 10 29 金源分店
20 红霉素软膏 56 5 金源分店
21 西洋参含片 19 300 金源分店
22 双黄连口服液 20 20 花园桥分店
23 莲花清瘟胶囊 45 21 花园桥分店
24 藿香正气水 58 10 花园桥分店
25 大山楂丸 29 15 花园桥分店
26 红霉素软膏 6 5 花园桥分店
27 西洋参含片 65 300 花园桥分店
28 清开灵口服液 38 32 花园桥分店
29 十全大补胶囊 7 55 花园桥分店
30 四物颗粒 10 45 花园桥分店
31 双黄连口服液 68 20 人大分店
32 莲花清瘟胶囊 25 21 人大分店
33 藿香正气水 35 10 人大分店
34 红霉素软膏 35 5 人大分店
35 西洋参含片 65 300 人大分店
36 清开灵口服液 48 32 人大分店
37 十全大补胶囊 35 55 人大分店
38 四物颗粒 32 45 人大分店

1.读取附件中excel文件drug_order_detail_1.xlsx中的数据。(提示:本平台读取excel文件时,函数的工作表参数为:sheet_name。)‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬

2.计算所有分店的总销售额并打印输出。‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬

3.增加“销售额”列,其中,销售额=价格*销量‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬

4.按分店统计不同分店销售额的最小值,最大值,平均值。并打印输出。‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬

5.输出效果如下所示,其中,*号代表具体统计的数据。‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬

所有分店总销售额是:*
amin amax mean
分店
人大分店 * * *
四季青分店 * * *
花园桥分店 * * *
金源分店 * * *

代码及运行结果

import pandas as pd
import numpy as np

df = pd.read_excel('space/drug_order_detai_1.xlsx')
df['销售额'] = df['价格'] * df['销量']
result = df.groupby('分店')['销售额'].agg([np.min, np.max, np.mean])
print('所有分店总销售额是:', df['销量'].sum(), sep='')
print(result
  • 5
    点赞
  • 76
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值