MC公司购物网站用户行为分析
项目背景
MC公司原是传统零售行业,随着电子商务发展,为了拓展公司业务,推出网购业务。为了平台创造出更多的利润,并且能够合理的投放广告,使用网站18个月后数据进行分析,根据复够率、回购率、高额消费用户等指标以及消费模型得到高价值的用户进行有针对的客户管理和维护。
一、提出问题
本次数据分析主要想解决以下问题
- 用户各个行为之间的转化率是多少?如何提升用户各个行为转化率。
- 用户在不同时间尺度下的行为规律,找到用户在不同时间周期下的活跃规律。
- 用户分类,哪些是核心用户。
(1) 结构化分析指标体系
根据现有数据及分析目的,从四个维度进行分析:
- 用户购物情况整体分析
- 商品购买情况分析
- 用户行为转化漏斗分析
- 参照RFM模型,对用户进行分类,找出有价值的用户
数据整理
(1)数据源
MC电子商务网站大约有100万用户,本次数据源选取了2019年11月17日到2019年12月5日随机用户的300万条数据。
数据源包含
字段名 | 说明 |
---|---|
用户ID | 整数类型,序列化后的用户ID |
商品ID | 整数类型,序列化后的商品ID |
商品类目ID | 整数类型,序列化后的商品所属类目ID |
行为类型 | 字符串,枚举类型,包括(‘pv’, ‘buy’, ‘cart’, ‘fav’) |
时间戳 | 行为发生的时间戳 |
数据总数统计
用户数 | 产品数 | 商品类目 |
---|---|---|
29211 | 810419 | 6875 |
(2)数据清洗
- 把时间戳数据变为时间格式
- 缺失值处理
- 删除重复值
- 一致化处理
用户行为
(1)总体情况
(1.1)用户转化
只有10%的用户在浏览商品后加入购物车或收藏。也就是说只有10%的用户有购买意愿。加入购物车或收藏的商品只有23%实现最后的支付。
CREATE view Total
AS
select SUM(CASE WHEN "Behavior"='pv' THEN 1 ELSE 0 END) AS "点击数",
SUM(CASE WHEN "Behavior"='fav' THEN 1 ELSE 0 END)