一、前期准备
分析要用到两个包:NumPy和Pandas,首先确保jupyter中成功安装了这两个包。
#导入numpy包
import numpy as np
#导入pandas包
import pandas as pd
二、基础知识
2.1 一维数据分析:NumPy
2.2 一维数据结构:Pandas
2.3 二维数据分析:numpy对应array
2.4 二维数据分析:pandas对应数据框DateFrame
此处遇到一个问题:读取Excel文件报错。
解决方法:
1 查看Excel文件存放路径
具体操作:点击文件名,鼠标右键,选择“属性”,找到下面标红的两个地方。
2 将上面标红的两处合成文件的路径,
格式为文件夹\文件名,比如F:\ann\Untitled1.ipynb
3 最后把路径中全部的斜杠(/)或者反斜杠(\)替换为双反斜杠(\\)
最后的路径为F:\\ann\\Untitled1.ipynb
三、Python具体案例分析:药店销售数据
3.1 提出问题
分析指标:月均消费次数
月均消费金额
客单件
消费趋势
3.2 理解数据
3.3 清洗数据