SQL项目实战练习:淘宝用户行为数据分析实战

1、数据的简介:天池淘宝用户数据

在这里插入图片描述在这里插入图片描述

2、数据导入和清洗

这次使用的SQL界面工具-SQL workbench

2.1 导入数据
create table userbehavior(
userID int,
itemID int,
categoryID int,
bahaviortype text,
timestamp int
);

load data infile "C:/ProgramData/MySQL/MySQL Server 8.0/Uploads/UserBehavior.csv"
into table userbehavior
fields terminated by ','
lines terminated by '\n';

我们看一下这个数据大概的样子:

select * from userbehavior limit 10;

在这里插入图片描述

2.2 数据清洗

根据字段内容进行分析后,将UserID,ItemID,TimeStamp设置成联合主键,经验证,不存在数据重复。

select UserID,ItemID,TimeStamp from userbehavior 
GROUP BY UserID,ItemID,TimeStamp having count(1)>1;

在这里插入图片描述

2.3 查看数据的缺失值
 select count(userID), count(itemID), count(categoryID), count(bahaviortype), count(timesstamp) 
 from userbehavior;

在这里插入图片描述
这里数据实在太大,达到了100150807,为了快速的完成,这里只采用了500000

2.4 数据的时间处理

这里的数据是一个时间戳,我们需要将这个数据转换到我们日常常用的时间格式

create table usertest2(
	select * from userbehavior limit 500000
);
# 时间进行转换到日常格式
UPDATE usertest set datee = FROM_UNIXTIME(timesstamp,'%Y-%m-%d'), Timee = FROM_UNIXTIME(timesstamp,'%h');
#增加两个列
alter table userbehavior change Date datee date;
alter table userbehavior change Timee Timee varchar(10);

在这里插入图片描述

2.5 异常值处理
select max(datee), min(datee) from usertest;

在这里插入图片描述
这里的时间是2017-12-03年到2017-09-11的之间的数据

3、数据分析

3.1 这里先看一下用户行为的分布
create view user_p as 
select userID, itemID,
sum(case when bahaviortype = 'pv' then 1 else 0 end) as click,
sum(case when bahaviortype = 'fav' then 1 else 0 end) as favor,
sum(case when bahaviortype = 'buy' then 1 else 0 end) as buy,
sum(case when bahaviortype = 'cart' then 1 else 0 end) as buycar from usertest group by userID,  itemID
;
SELECT * FROM day01.user_p;

在这里插入图片描述
这里是创建了一个视图,方便数据的简化和操作,关于视图的知识可以看下面两篇文章:
视图1:https://www.w3school.com.cn/sql/sql_view.asp
SQL视图的作用:https://blog.csdn.net/weixin_34037515/article/details/92609031

3.2 数据层级的漏斗转化(基于漏斗分析)

  • 10
    点赞
  • 57
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 5
    评论
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

行秋即离

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值