淘宝用户购物行为分析

m0_68219842

已于 2022-07-11 21:15:32 修改

阅读量2.4k

点赞数 4

文章标签：数据分析 mysql

于 2022-07-09 17:52:03 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_68219842/article/details/125693135

版权

目录

一、项目介绍

1.2 分析思路

二、数据预处理

2.1 数据抽样、导入数据

2.2 数据清洗

2.3 导出数据

三、数据分析

3.1 从网站维度分析用户行为

3.1.2 转化率

3.2 从时间维度分析用户行为

3.2.1 每天的用户行为

3.2.2 每小时的用户行为

3.3 从商品维度分析用户行为

3.3.1 四种环节排名前十的产品

3.3.2 按照商品销量对商品分类统计

3.4 从RFM模型分析用户质量

四、总结及建议

一、项目介绍

1.1 数据集

数据集来源：淘宝用户购物行为数据集

本数据集包含了2017年11月25日至2017年12月3日之间，有行为的约一百万随机用户的所有行为（行为包括点击、购买、加购、喜欢）。数据集的组织形式和MovieLens-20M类似，即数据集的每一行表示一条用户行为，由用户ID、商品ID、商品类目ID、行为类型和时间戳组成，并以逗号分隔。关于数据集中每一列的详细描述如下：

列名称	说明
UserID	用户ID，整数类型，序列化后的用户ID
ItemID	整数类型，序列化后的商品ID
CategoryID	整数类型，序列化后的商品所属类目ID
BehaviorType	字符串，枚举类型，包括('pv', 'buy', 'cart', 'fav')
TimeStamp	行为发生的时间戳

用户行为类型共有四种，它们分别是：

行为类型	说明
pv	商品详情页pv，等价于点击
buy	商品购买
cart	将商品加入购物车
fav	收藏商品

数据集大小说明如下：

维度	数量
用户数量	987,994
商品数量	4,162,024
商品类目数量	9,439
所有行为数量	100,150,807

1.2 分析思路

使用工具：MySQL Workbench、Excel、Jupyter Notebook

使用MYSQL数据库，先用Jupyter Notebook进行20%的数据抽样，然后在Workbench上进行数据预处理，最后用Workbench和EXCEL进行数据分析和可视化。

二、数据预处理<

最低0.47元/天解锁文章

关注

4
点赞
踩
32

收藏

觉得还不错? 一键收藏
1
评论
淘宝用户购物行为分析

淘宝用户购物行为分析
复制链接

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。