一、项目背景
基于千万级的淘宝用户的使用记录,对淘宝用户的行为进行分析,具体指标包括:日PV、日UV、不同用户行为的PV、用户复购率、活跃用户消费率,用户分层情况等。
流量指标分析:
用户行为分析:
二、 分析思路梳理
1.数据来源
阿里天池官方发布的1万用户在2014年双十二期间的行为记录,数据量达1200万+。
数据下载地址:数据集-阿里云天池
2.数据结构
user_id:用户ID
item_id:商品ID
behavior_type:用户行为类型(包含1点击、2收藏、3加购物车、4支付)
user_geohash:地理位置
item_category:商品类别ID
time:记录时间
3.数据清洗
导入mysql进行数据整理。
重复值