python商品销售情况数据分析_药店商品销量分析(python)

最新推荐文章于 2024-06-30 15:34:32 发布

weixin_39849671

最新推荐文章于 2024-06-30 15:34:32 发布

阅读量2.1k

点赞数 3

文章标签： python商品销售情况数据分析

本文通过Python对药店销售数据进行分析，包括数据清洗、异常值处理，计算月均消费次数、月均消费金额、客单价等业务指标，并绘制消费趋势图，发现热销和滞销商品。数据来源于朝阳医院2018年的销售记录，共6579条，涉及7个字段。

摘要由CSDN通过智能技术生成

一、数据分析的步骤

二、提出问题

分析药店商品销售情况

1)月均消费次数

2)月均消费金额

3)客单价

4)消费趋势

5)热销商品、滞销商品

三、理解数据

销售数据源为excel文件

字段的含义：

共有6579条销售数据

共有7个字段分别为：购买时间、社保卡号、商品编码、商品名称、销售数量、应收金额、实收金额

四、清洗数据

本次分析采用Jupyter Notebook分析，数据集为本地excel文件

(1)选择子集

本次分析的excel工作簿里面只有一个工作表

#导入数据分析包

importpandas as pd

salesDf= pd.read_excel('./朝阳医院2018年销售数据.xlsx')#head()打印前5行

#df = pd.read_excel(path,sheet_name=4,header=6)# 指定序号为4的工作簿，用第6行做为行索引

"""sheet_name,工作簿的序号从0开始 """

#header从0开始计数

print(salesDf.head())

(2)列表重命名

#字典：旧列名和新列名对应关系

colNameDict = {'购药时间':'销售时间'}'''inplace=False，数据框本身不会变，而会创建一个改动后新的数据框，

默认的inplace是False

inplace=True，数据框本身会改动'''salesDf.rename(columns= colNameDict,inplace=True)

salesDf.head()

(3)删除重复值

print('删除重复值前大小',salesDf.shape)#删除重复销售记录

salesDf =salesDf.drop_duplicates()print('删除重复值后大小',salesDf.shape)

删除前后数据进行对比，发现本数据集没有重复值

(4)缺失值处理 info也可以查看字段的数据类型

"""整体观察"""df.info()"""如果缺失的数据很少，可以直接进行删除"""

"""如果缺失的数据量较大，

最低0.47元/天解锁文章

weixin_39849671

关注

3
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
python商品销售情况数据分析_药店商品销量分析(python)

一、数据分析的步骤二、提出问题分析药店商品销售情况1)月均消费次数2)月均消费金额3)客单价4)消费趋势5)热销商品、滞销商品三、理解数据销售数据源为excel文件字段的含义：共有6579条销售数据共有7个字段分别为：购买时间、社保卡号、商品编码、商品名称、销售数量、应收金额、实收金额四、清洗数据本次分析采用Jupyter Notebook分析，数据集为本地excel文件(1)选择子集本次分析的e...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。