- 数据来源及说明
- 提出问题
1) 整体用户的购物情况
2) 用户行为转化漏斗
3) 购买率高和购买率为0的人群有什么特征
4) 基于时间维度了解用户的行为习惯
5) 基于RFM模型的用户分析 - 数据清洗
1)导入数据
2)缺失值处理
3)数据一致化处理 - 构建模型和分析问题
1) 总体用户购物情况
日均访问量
uv(用户总数)
有购买行为的用户数
用户的购物情况
2.用户行为转化漏斗
3.购买率高和购买率低的人群有什么特征 - 基于时间维度了解用户的行为习惯
(1)一天中用户的活跃时段分布
(2)一周中用户活跃时段分布 - 基于 RFM 模型找出有价值的用户
(1)计算R-Recency
(2)计算F-Frequency
(3)对用户进行评分 - 结论:
1.数据来源及说明
本文从数据集中选取包含了2014年11月18日至2014年12月18日之间,8477名随机用户共1048575条行为数据,数据集的每一行表示一条用户行为,共6列。
列字段包含以下:
user_id:用户身份
item_id:商品
IDbehavior_type:用户行为类型(包含点击、收藏、加购物车、购买四种行为,分别用数字1、2、3、4表示)
user_geohash:地理位置(有空值)
item_category:品类ID(商品所属的品类)
time:用户行为发生的时间
2.提出问题
1)整体用户的购物情况
Pv(总访问量),日均访问量,uv(用户总数),有购买行为的用户数量,用户的购物情况,复购率分别是多少?
2)用户行为转化漏斗
点击-加购物车-收藏-购买各环节转化率如何?购物车遗弃率是多少,如何提高?
3)购买率高和购买率为0的人群