数据介绍
参考报告:https://bbs.fanruan.com/thread-139013-1-1.html
这里是给了一个淘宝用户的数据集,用来分析运营中出现的问题,对用户在购物中出现的行为进行分析,得出结果并给出优化建议。
先介绍一下数据每个字段的意义:
第一张表:tianchi_mobile_recommend_train_user
user_id:用户编号
item_id:商品编号
behavior_type:用户行为(1:浏览 2:收藏 3:加购物车 4:购买)
user_geohash:用户地理位置(无用)
item_category:商品类别
time:用户行为时间
第二张表:tianchi_mobile_recommend_train_item(基本没用到)
字段意义同上,地理位置也是一样没用的,后续删掉即可
数据清洗
导入部分就是一样的csv文件导入即可
然后这里我的数据跟参考报告的好像有点出入,我的数据比他多不少,并且在power query中也并没有发现空值和异常值,所以这里只要将两张表中的地理位置删除即可
这里将user表中的time列拆分成两列:日期和小时数分开,使用拆分列,按照空格拆分开就行
然后我将商品编号和商品类别都改成了文本类型,这也是后面可视化发现的问题,否则是达不到挑选出某个编号、类别的要求的(123->ABC)
这里还进行了一步操作,就是将用户行为列中的数字一一替换成文本,要先转换文本类型再替换哦,不然不成功
数据分析
分析思路
这里使用的是漏斗模型,来观察从浏览到购买的转化率有多少,以此来探索提高转化率的方法,然后再使用假设的方法,从多个维度探讨影响转化率的因素
用户流失情况
商品类别总数和商品数量,新建度量值,直接用一个distinctcount来统计即可,是不重复计数的,这里我的商品数量取的是item表中的,并且直接用的count,我觉得数量就不用去重了
后面四个用到一个filter函数,第一个参数是操作的表,第二个参数是判断条件
接下来画漏斗图,求转化率我们还是用占比表示更清楚,所以我又创建了四个度量值,用这些来画漏斗图
结论:
我们可以看出94%的用户浏览后加入购物车只有3%,而最终购买的只有1%
猜测:
用户在淘宝浏览了很多产品,却没找到自己心仪的,所以选择更换平台
验证猜测:
1.用户想在平台找什么样的商品
2.用户习惯什么时间购买
3.平台推送的商品是否满足用户需求
用户流失情况原因分析
用户想要在淘宝找到什么商品
衡量用户想找什么样的商品的标准是浏览量,所以我们只关注浏览量即可
浏览量我们之前已经建过度量值了,作为x轴,y轴就是商品类别了,主要就是如何显示浏览量前5的商品类别,这里用筛选器很方便
接下来我们要做的是在浏览量前五的商品类别中分别找出浏览量前三的商品编号,这里我做了很久,也用python试了,但是一直没有弄出来,后来突然发现用切片器很方便,没必要非做成报告那样(就是这里切片器跟上面条形图是放在一面的,所以不想切片器影响到条形图就去【格式】里面点击【编辑交互】然后点击条形图右上角一个小圈就行)
结论:
1.我们从图中看出商品类别编号为1863、13230、5027、5894、6513的在淘宝APP中浏览数最高,说明用户最想要在淘宝平台中找到这五类商品。
2.各类商品中,5027类的商品需求较高,6513类的商品需求量相对较小。
用户习惯什么时候购买商品
这里我们之前切分的time列就用上了,如何取前五的商品类别就是用筛选器,跟前面的一样
第三个我们将商品编号放在图例上,也是一样添加筛选器即可,商品类别我就做了个切片器,效果也是一样的,因为筛选器不允许有多个取前N个的
结论:
1.由图可知,由于双12活动,这五类商品在双十二前后浏览量增加
2.我们发现用户搜索这五类商品的时间集中在20:00以后,21:00左右达到最高值
3.对比可知,18-23点这个时间段,用户明显活跃起来。对此,有做站内付费推广(如直通车、钻展等)的商家可以侧重于这几个时间段加大投放,争取流量获得最大转化。
淘宝平台推送的商品是否满足用户需求
这里报告用的是表格,我做的是折线柱形图,观察前五类商品数量在总数量中的占比
下面两个是观察浏览量前五的商品购买量有多少,和购买量前五的商品类别,都是用筛选器做的
结论:
1.淘宝平台共有8916种品类,而需求量最多的前五类商品在商品数量上占比还是比较多的,说明淘宝平台对这五类商品的提供了足够多的选择。
2.除了1863类商品的购买次数较多外,其他需求多的四类商品的购买次数并不多,甚至都没有进入购买次数的前五名。显然,需求最高的五类商品的购买数都远低于购买数最高的五类商品,说明淘宝对这五类需求最高的商品的推送机制并不合理,淘宝平台给用户推送的这五类商品没有满足用户的要求,即用户在点击查看该类商品后,发现并不是自己想要的商品放弃加入购物车,造成转化率的降低。
小结建议
1.算法要改进,多推送浏览量前五位的商品给用户,并且监控用户购买情况,优先将销量较高的商品推给用户,节约用户时间,提高转化率
2.要多投放有关这五类商品的广告,尤其是每一类前三名,获取更多的用户到淘宝
3.淘宝的用户搜寻商品的时间段主要在下午6点至晚上11点,也就是大多数人下班后休息的时间。建议运营部门在这个时间段对这五类商品多策划一些营销活动,例如“聚划算”、“满减活动”等,刺激用户消费,提高用户转化率。并对这五类商品中需求很高的一些商品,精确用户对这些商品的主要搜寻时间段,在这些主要的搜寻时间对该商品进行促销活动。