08 数据分析与SQL Project(基于零售数据挖掘业务特征)
1.建立数据库
项目的流程是:
- 下载本地工具(见本部分00导学)
- 下载sqlite数据库(1.2M)
- 打开并且浏览数据
- 将感兴趣的数据筛选后输出为.csv文件
- 用 Excel 处理此文件,并可视化(也可用其他工具)
- 提交 PPT 报告(请详细看要求)
- PS:在商品名字中有部分字符乱码请大家忽略
2.数据库查询
数据字典
- SupplierID 和 CategoryName 是对应的,前面是数字编号,后面是分类名字
- UnitPrice 单价
- UnitsinStock 存量
- UnitsOnOrder 订单量
- ReorderLevel 再次订货水平(这个没有说明,可能是再次订货的发生概率之类的衡量指标)
- 剩下指标没有很大意义,先不做分析。
不过在看数据的时候,还是会发现一些好玩的事情,比如看过豆腐这个吓人的价格之后,我吓的赶紧让家里人买了2块吃了下压压惊(要知道后面有个蟹棒24oz的价格还没有豆腐贵):