本文案例取自猴子社群药店销售数据分析案例,因个人习惯。和原案例代码有所不同,但终究殊途同归,希望能给初学者以思考。此外,本文增加了可视化部分。
数据分析步骤可分为5部分:
1、提出问题
2、理解数据
3、数据清洗
4、构建模型
5、数据可视化
一、提出问题
所有的数据分析首先必须得有一个目标,得知道你需要啥,才能有针对性的去做分析工作。
这里应业务部门需求,要求得知以下几个指标:月均消费次数,月均消费金额,客单价和消费趋势。
二、理解数据
现业务部门提供了一份Excel销售数据,我们首先创建分析环境,并把数据导入进来。
import numpy as np
import pandas as pd
from datetime import datetime
导入Excel数据有两种方法,read_excel和Excelfile,前者是导入路径后者是创建对象,建议使用后者,以免数据复杂时出错。
xls=pd.ExcelFile(r'C:\Users\hubiao1\Desktop\朝阳医院2018年销售数据.xlsx',dtype='object')
saldf=xls.parse('Sheet1',dtype='object')
导入后,查看下数据的大致情况,head看头,tail看尾巴。
saldf.tail()