数据链接:https://pan.baidu.com/s/11ZtjKnv5-nwyf6cMyk_3JQ
提取码:yu63
包含用户数据userinfo和订单数据orderinfo,数据均为UTF-8格式。
分析问题:
1-统计不同月份的下单人数
2-统计用户三月份的回购率和复购率
3-统计男女的消费频次是否有差异
4-统计多次消费的用户,第一次和最后一次消费时间的间隔
5-统计不同年龄段的用户消费金额是否有差异
6-统计消费的二八法则,消费的top20%用户,贡献了多少额度
一、导入数据
由于数据量较大(分别是10万和50万条),这里直接使用cmd命令行导入。
建立用户表:
CREATE TABLE USERINFO (
USERID varchar(10) NULL,--用户ID,主键
SEX varchar(10) NULL,--性别
BIRTH varchar(30) NULL --生日)
建立订单表:
CREATE TABLE ORDERINFO (
ORDERID varchar(10) NULL,--订单ID,主键
USERID varchar(10) NULL,--用户ID,可以和用户表进行关联
ISPAID varchar(10) NULL,--是否支付
PRINCE varchar(10) NULL,--订单价格
PAIDTIME varchar(30) NULL --订单支付时间
)
将数据从CSV导入数据库:
load data infile 'E:/SQL-用户行为分析/user_info_utf.csv' into table userinfo fields terminated by ',';
load data infile 'E:/SQL-用户行为分析/order_info_utf.csv' into table orderinfo fields terminated by