一背景介绍及数据来源
在互联网的时代下,电商平台提供给网民很多便利,如:提升了购物选择性、更直观的展示出各类商品的优惠折扣以及降低了购买成本等等。网购已经逐渐渗透进我们的生活。淘宝是电商圈里龙头企业,创造过无数奇迹,如“双十一”购物热潮及单日交易额百亿元等历史性的突破。淘宝平台不停的更新迭代,提供了更多的个性化服务。淘宝在2003年创立的,2012年注册会员近5亿,日活跃用户超1.2亿。接下来会通过淘宝2017年11月25日至2017年12月3日的随机用户行为的数据对淘宝进行用户行为分析,找出问题并提出优化方案。 分析工具:Mysql,Navicat,Power bi
二理解数据
原始数据一共有5个字段
1user_id,用户id,是用来识别用户的编号,不同的编号代表不同的用户。
2item_id 商品id,用来识别商品的编号,不同的编号代表不同的商品。
3category_id 商品类别id,用来识别商品类别的编号,不同的编号代表商品属于不同的类别。
4behavior_id 行为id,用来识别用户的不同行为。
pv-页面游览,就是代表用户点击商品页面,进入游览。
cart-商品加购,就是代表用户将商品加入购物车。
fav-商品收藏,就是代表用户将商品放入收藏。
buy-商品购买,就是代表用户购买商品。
5timestamp-时间戳,代表从1970年1月1号0点0分到发生用户行为的总秒数。
三明确问题及目的
1各环节的转化率是多少,哪个环节的转化率偏低
2各类商品的情况
四分析思路
五数据清洗
1)查找重复值并删除
未发现重复值
2)查找缺失值
未找到缺失值
3)数据格式处理
日期原本为时间戳的形式,不利于后面的数据处理,所以使用FROM_UNIXTIME函数将其转化为常用形式。
添加出日期列,时间列,日期时间列,星期列
4)异常值删除
因为是分析2017年11月25日至2017年12月3日的数据,所以删除其他日期的数据。
删除44个异常值
六模型构建
-
各个环节转化率是多少
1)对整体数据认识
创建视图,方便后面查看
一共有983名用户,64440个商品,涉及3128个商品类别
2)数据处理
使用AIPL漏斗分析
将behavior_type进行行列转化,创建视图方便后面查看
A-Awareness 认知:pv
I-Interested 兴趣:cart,fav
P-Purchase 购买:buy
L-Loyalty 忠诚:复购
由于整个数据周期较短,所以复购率并没有很大意义,故此忽略,只查看前三个的转化率。
将Power BI 和数据库连接
创建漏斗图
建立度量值收藏加购
得到每个部分的转化率
游览到收藏加购的转化率为9.12%
收藏加购到购买的转化率为23.02%
整体转化率为2.1%
发现游览到收藏加购的转化率比较低,使用假设分析法
(1)计算商品的收藏加购和购买情况
收藏加购过的商品一共有7694种
商品一共64440种
得出商品中一共有12%被收藏加购,在查看这些商品的购买情况
先用sql,在用excel
发现有收藏加购中448个商品被购买,说明收藏加购的商品有5.8%被购买,再看一下商品的整体购买情况
一共有1773种商品被购买,购买率2.8%
发现商品的收藏加购和购买率都比较低,结论成立,对于购买数和收藏加购数都很低的商品建议清仓出售。
(2)观察商品游览和收藏加购,购买数量对比
通过图表发现游览量,购买数量和收藏加购三者未发现关系。再使用Excel进行相关性分析,相关系数都小于0.3,没有什么相关性,说明结论成立,建议优化广告推送机制。
建议推送购买和收藏加购最多的商品
3)将各阶段转化率按时间维度分解
发现购买转化率上下起伏很大,而收藏加购的转化率比较平稳,将购买转化率拿出来单独分析。
将游览量低于平均值得暂时忽略。
对于高于平均转化率的时间段18,14,11,16,17,12,10,13点可以重点投放广告。
-
将商品按类别分解
使用powerbi统计
购买最多的商品种类是2735466,1464116,4145813,4801426,2885642
收藏加购最多的是4756105,4145813,3607361,982926,4801426
游览最多的是4756105,3607361,4145813,2355072,982926
通过图表发现发现商品种类的游览,收藏加购和购买可能存在相关性。
使用Excel链接powerbi,进行相关性计算
发现三者存在强相关性,说明对于商品种类的人群定位做得比较好,广告推送取得好的效果,可以继续保持。
七总结
1.通过分析发现,游览到收藏加购的转化率为9.12%,收藏加购到购买的转化率为23.02%,整体转化率为2.1%。
2.商品一共64440种,一共有7694种被收藏加购,一共1773种被购买,大量的商品没有产生价值。而且大量商品游览没有产生收藏和购买行为,说明对于商品的推送机制需要改进。
3.18,14,11,16,17,12,10,13点的游览转化为收藏加购比例比较高。
4.商品种类的推送机制比较好,产生了大量的收藏加购和购买行为。
八建议
产品部
1.建议对于购买数量少,收藏加购少的商品进行优化。
市场部
1.建议投放广告时可以在18,14,11,16,17,12,10,13点,转化率较高。
运营部
1.建议将购买数量和收藏加购全都等于0的商品进行清仓处理。
2.建议保留商品种类的推送机制,重点优化具体商品的推送机制。