DataFrame、Series练习题——租房数据预处理

最新推荐文章于 2023-11-17 18:56:37 发布

置顶

CSDNWV

最新推荐文章于 2023-11-17 18:56:37 发布

阅读量7.2k

点赞数 5

文章标签： python 数据挖掘数据分析机器学习 anaconda

本文链接：https://blog.csdn.net/CSDNWV/article/details/121641665

版权

DataFrame、Series

To 大数据的友友：代码慢慢堆 ~ 终究会起飞 ~ Except Ctrl+V ~ Salute！

从字典dict构建Series

描述

从字典dict构建Series参考输出示例输出。输出如下

a    9
b    8
c    7
d    6
dtype: int64
<class 'pandas.core.series.Series'>

代码及运行结果

import pandas as pd
d = {
   "a":9,"b":8,"c":7,"d":6}
a_Series = pd.Series(d)
print(a_Series)
print(type(a_Series))

a    9
b    8
c    7
d    6
dtype: int64
<class 'pandas.core.series.Series'>

进程已结束，退出代码为 0

用pandas和numpy分析药店的营业数据

以下是某连锁药店销售数据，请使用numpy、pandas相关做分析。要求如下：‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬

序号	药名	销量	价格	分店
1	双黄连口服液	89	20	四季青分店
2	莲花清瘟胶囊	45	21	四季青分店
3	藿香正气水	55	10	四季青分店
4	大山楂丸	66	15	四季青分店
5	感冒清热颗粒	13	25	四季青分店
6	六君子胶囊	39	40	四季青分店
7	生脉饮	10	29	四季青分店
8	红霉素软膏	56	5	四季青分店
9	西洋参含片	19	300	四季青分店
10	清开灵口服液	99	32	四季青分店
11	十全大补胶囊	89	55	四季青分店
12	四物颗粒	45	45	四季青分店
13	双黄连口服液	30	20	金源分店
14	莲花清瘟胶囊	21	21	金源分店
15	藿香正气水	55	10	金源分店
16	大山楂丸	66	15	金源分店
17	感冒清热颗粒	13	25	金源分店
18	六君子胶囊	39	40	金源分店
19	生脉饮	10	29	金源分店
20	红霉素软膏	56	5	金源分店
21	西洋参含片	19	300	金源分店
22	双黄连口服液	20	20	花园桥分店
23	莲花清瘟胶囊	45	21	花园桥分店
24	藿香正气水	58	10	花园桥分店
25	大山楂丸	29	15	花园桥分店
26	红霉素软膏	6	5	花园桥分店
27	西洋参含片	65	300	花园桥分店
28	清开灵口服液	38	32	花园桥分店
29	十全大补胶囊	7	55	花园桥分店
30	四物颗粒	10	45	花园桥分店
31	双黄连口服液	68	20	人大分店
32	莲花清瘟胶囊	25	21	人大分店
33	藿香正气水	35	10	人大分店
34	红霉素软膏	35	5	人大分店
35	西洋参含片	65	300	人大分店
36	清开灵口服液	48	32	人大分店
37	十全大补胶囊	35	55	人大分店
38	四物颗粒	32	45	人大分店

1.读取附件中excel文件drug_order_detail_1.xlsx中的数据。（提示：本平台读取excel文件时，函数的工作表参数为：sheet_name。）‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬

2.计算所有分店的总销售额并打印输出。‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬

3.增加“销售额”列，其中，销售额=价格*销量‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬

4.按分店统计不同分店销售额的最小值，最大值，平均值。并打印输出。‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬

5.输出效果如下所示，其中，*号代表具体统计的数据。‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬

所有分店总销售额是：*
amin amax mean
分店
人大分店 * * *
四季青分店 * * *
花园桥分店 * * *
金源分店 * * *

代码及运行结果

import pandas as pd
import numpy as np

df = pd.read_excel('space/drug_order_detai_1.xlsx')
df['销售额'] = df['价格'] * df['销量']
result = df.groupby('分店')['销售额'].agg([np.min, np.max, np.mean])
print('所有分店总销售额是：', df['销量'].sum(), sep='')
print(result

最低0.47元/天解锁文章

CSDNWV

关注

5
点赞
踩
76

收藏

觉得还不错? 一键收藏
1
评论
DataFrame、Series练习题——租房数据预处理

从字典dict构建Series描述从字典dict构建Series参考输出示例输出。输出如下a 9b 8c 7d 6dtype: int64<class 'pandas.core.series.Series'>代码及运行结果import pandas as pdd = {"a":9,"b":8,"c":7,"d":6}a_Series = pd.Series(d)print(a_Series)print(type(a_Series))a
复制链接

扫一扫