背景:
基于某公司2017年6月份销售数据和会员信息,所采用的数据来源于某课程提供的数据集。
由于电商数据分析中涉及到的指标繁重复杂,数据集所提供的信息并不完整,本文依据已有数据信息对其中一部分指标进行分析。
本数据集包含原始数据集如下:
客户相关文件:
- UserInfo.csv:用户主表
- RegionInfo.csv:区域表
订单相关文件:
- OrderInfo.csv:订单主表
任务:
1、理解数据,并根据规则创建表
2、导入数据
3、数据清洗、字段处理
4、按照问题要求关联各表,查询结果
5、使用power pivot建立层次结构,并可视化
行动:
1、创建表(以userinfo为例)·
使用的是MySQL
f
create table userinfo (
userid VARCHAR(6) not null default'-',
username VARCHAR(20) not null default'-',
userpassword VARCHAR(100) not null default'-',
sex INT not null default'0',
usermoney INT not null default'0',
frozenmoney INT