数据分析的基本步骤包括:
1、提出问题
2、理解数据
3、清洗数据
4、构建模型
5、数据可视化
默认环境使用Anaconda软件,python3语言,win10系统
在这里使用朝阳医院18年销售数据作为案例
1、提出问题
假如我们要得到以下指标:
月均消费次数、月均消费金额、客单价、消费趋势
2、理解数据
2.1 安装一个读取excel文件的依赖包:xlrd(如非第一次操作,请跳过)
打开后输入命令:conda install xlrd
等待其结束就好
2.2 将数据信息导入jupyter目录(如非第一次操作,请跳过)
点击“Upload”找到对应文件上传即可
2.3读取数据
打印前五行: