淘宝用户行为分析

一.分析背景和目的

在互联网的时代下,电商平台提供给网民很多便利,如:提升了购物选择性、更直观的展示出各类商品的优惠折扣以及降低了购买成本等等。网购已经逐渐渗透进我们的生活。淘宝是电商圈里龙头企业,创造过无数奇迹,如“双十一”购物热潮及单日交易额百亿元等历史性的突破。淘宝平台不停的更新迭代,提供了更多的个性化服务。淘宝在2003年创立的,2012年注册会员近5亿,日活跃用户超1.2亿。接下来会通过淘宝2017年11月25日至2017年12月3日的随机用户行为的数据对淘宝进行用户行为分析,找出问题并提出优化方案。

二.理解数据

2.1 数据来源

数据集-阿里云天池

2.2 数据集介绍

本数据集(UserBehavior.csv)包含了2017年11月25日至2017年12月3日之间,有行为的约一百万随机用户的所有行为(行为包括点击、购买、加购、喜欢)。数据集的组织形式和MovieLens-20M类似,即数据集的每一行表示一条用户行为,由用户ID、商品ID、商品类目ID、行为类型和时间戳组成,并以逗号分隔。

注:此次分析导入10万条数据进行分析。

2.3 字段介绍

在这里插入图片描述
注意到,用户行为类型共有四种,它们分别是
在这里插入图片描述
关于数据集大小的一些说明如下
在这里插入图片描述

三.业务问题和分析思路

3.1业务问题

3.1.1用户角度

用户活跃度和时间的关系?
用户的使用天数和购买的关系?
从登陆-点击-收藏/加购-下单的各环节转换率是多少?
用户的价值分类?
平台产品复购率情况?
####3.1.2产品角度

平台的商品成交量怎么样?
平台产品被点击/收藏/加购/购买的情况?

3.2分析思路

在这里插入图片描述

四、数据清洗

1)选择子集

数据量过大,此次分析选择10万条数据作为练习,表名是userbehavior。
在这里插入图片描述

2)对列名重命名

此数据集没有列名,在navicat可视化界面直接修改第一行数据(推荐)或者用sql修改,并添加第一行的数据。
在这里插入图片描述

3) 查看是否有重复值

备份原表数据,统计重复值,发现没有重复值。
在这里插入图片描述

4) 查看是否有缺失值

统计所有列数据总量,总计数一致,没有缺失值。
在这里插入图片描述

5) 一致化处理

时间这一列需要改成日期和时间的格式,增加两列,方便后续数据分析。
在这里插入图片描述
在这里插入图片描述

6) 数据排序

通过数据排序能发现更多信息。把日期列按升序排序,发现在2017-11-25 ~ 2017-12-3范围外的日期,这些作为异常值在下一步处理。
在这里插入图片描述

7) 异常值处理

在2017-11-25 ~ 2017-12-3范围外的日期有44条,删除44条异常值。至此数据清洗完毕。
在这里插入图片描述
44条异常数据
在这里插入图片描述
删除异常值
在这里插入图片描述
删除后的数据

五、数据分析和构建模型

5.1 从用户维度分析

5.1.1 了解数据的整体信息

在这里插入图片描述在2017-11-25-2017-12-03的9天时间内,淘宝用户983位,3128个商品类目,64440个商品,4种行为类型即点击/收藏/加购物车/购买。

5.1.2.用户的活跃度和时间关系
1)9天的活跃度:通过点击量pv和独立访问数uv分析。

在这里插入图片描述统计9天的pv和uv
在这里插入图片描述

图1
9天种点击量和独立访问数的变化如图1,其中11.25/26,12.02/03号都是双休日,其他5天是工作日。11.25-12.01这7天内pv/uv没有明显变化,12.02/12.03两天pv/uv开始上升。

问题:为什么12.02/03两天pv/uv都上升?

假设:双十二促销预热导致点击和访客上升

收集证据:
在这里插入图片描述

整体的销量是呈现上升趋势,12.2和12.3销量有明显上升。如果是促销预热,浏览和点击会上升,销量会在促销当天和前后1-2天出现上升。现在12.2/12.3销量就上升,说明不是促销预热。平台月初的促销行为更可能。

结论:双十二促销预热不成立。月初促销不确定,需要更多资料。

2)24小时内的用户活跃度:通过点击量pv和独立访问数uv进行相关性分析。

在这里插入图片描述
用mysql统计24小时内的pv和uv
在这里插入图片描述图2
结论:24小时内点击量pv和独立访问数分布如图2,其中2:00-6:00活跃度最低,6:00开始活跃度开始上升,晚上19:00-陵城1:00是一天最活跃阶段,其中21:00-23:00是最高峰。这和用户日常作息一致。

5.1.3 使用平台的时长和购买的关系
1)9天内初次购买转化周期

在这里插入图片描述
在这里插入图片描述
登陆当天购买的用户数最多,最长的转化周期是8天,超过8天用户不会再购买。平均转化周期是2.7天。

结论:关注浏览超过3天的用户,提升用户购买的转化。

2)使用天数和转化率的关系

把用户按照天数分组并创建视图:
在这里插入图片描述
统计出不同使用天数的用户数量:
在这里插入图片描述
统计不同使用天数的用户中有购买行为的数量:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述从上面图表中可以看出使用天数越长,用户购买的转化率越高。

结论:用户使用时间越长,转化成购买行为的概率越高。平台可以激励用户每天登陆淘宝,提高客户购买行为。

5.1.4 用群组分析方法和漏斗模型分析淘宝用户在各环节的转化率

用SQL创建视图用户行为统计表:
在这里插入图片描述

1)用户角度:用AARRR和漏斗分析方法分析用户的流失率

用户购买行为流程:点击-收藏或加购-下单,用SQL找出各环节留存用户。
在这里插入图片描述
在这里插入图片描述从上述漏斗图分析看到收藏或者加购到下单的环节留存是最低的也接近80%。

结论:淘宝平台各环节用户的留存率是非常好的。

2)流量角度:对流量在各环节转化率进行漏斗分析

首先总结淘宝用户行为所有路径和创建流量统计表视图。
在这里插入图片描述
在这里插入图片描述
创建流量统计表视图

(1)对浏览(点击)开始的路径进行分析

a.路径1:点击-购买
统计出这个路径的产品点击量和购买量,做流量转化漏斗图:
在这里插入图片描述
在这里插入图片描述

b.路径2:点击-收藏-购买
统计出这个路径的点击量,收藏了和购买量,做流量转化漏斗图:
在这里插入图片描述
在这里插入图片描述

c.路径3:点击-加购物车-购买
统计出这个路径的点击量,加购量和购买量,做流量转化漏斗图:
在这里插入图片描述
在这里插入图片描述

d.路径4:点击-收藏-购物车-购买
统计出这个路径的点击量,收藏量,加购量和购买量,做流量转化漏斗图:
在这里插入图片描述
在这里插入图片描述

由上图发现加购量比收藏多,出现转化率异常情况。
e.上述路径中异常问题分析
问题1:为什么点击-收藏-加购-下单中的收藏-转化的环节出现异常?
假设:一般用户只会收藏一次,加购可能多次
收集证据:用sql查出这个路径的所有数据(下图)
在这里插入图片描述

发现部分产品收藏次数一般只有一次,但是加购会有多次。
结论:假设正确,异常原因是一般用户只会收藏一次,但是加购可能多次。
问题2:为什么点击-购买的流量转化率很低?
假设1:平台推送的和用户喜欢的产品不一致。
收集证据:
a.单个商品点击前10和销售量前10商品对比
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
由上图对比分析得到点击量top10的商品和购买量top10的商品不存在重合。
b.商品类目点击前10 和销售量前10类目对比
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

点击量top10和购买量top10重合的商品类目ID
通过a和b分别对比分析发现,点击量top10和购买量top10的商品中没有重合的;点击量top10和购买量top10的商品类目有5个重合,占据总购买量263的48%。说明平台推送的单个商品和用户偏好的商品不吻合,平台推送的类目和用户偏好的类目重合度占48%。这个表现是非常差的。
结论:假设1正确。
假设2:商品销量过低,不能吸引用户购买。
收集证据:
在这里插入图片描述

查找购买次数top10的商品
在这里插入图片描述
在这里插入图片描述

销量top10的商品购买量不超过5件,销售量非常低,无法取得用户信任,不能吸引用户购买。
结论:假设2正确总结:点击-购买路径中,流量转化率低的原因有2方面:一是平台推荐的准确率低,推送的产品和用户偏好的产品不一致;二是没有爆款,大部分已售产品销量低,不能吸引用户信任和购买。
(2)对未浏览(0点击)开始的路径分析
a.路径1 :收藏-下单,整体转化率1.13%
在这里插入图片描述

b.路径2:收藏-加购-下单,整体转化率3.03%
在这里插入图片描述

c.路径3:加购-下单,整体转化率3.24%
在这里插入图片描述

d.路径4:直接下单
在这里插入图片描述

(3)分析总结

对浏览(点击)开始的4条路径进行对比分析:横向对比,点击-购买这条路径吸收了最大的流量,点击量占90.8%,订单量占据82.4%;纵向对比,点击购买的转化率是最低的只有2.02%,点击-加购-下单有9.16%,点击-收藏-加购-下单有9.13%,点击-收藏-下单有4.37%。
对未浏览(0点击)开始的路线进行对比分析,直接下单的订单量路线占据86.2%,是用户0点击路线的主要方式。结论:淘宝用户下单偏好使用行为更少的模式。点击-购买和直接购买是用户最喜欢用的方式。其中点击-购买的转化率过低。

5.1.5 用RFM模型分析淘宝用户价值

RFM指标:
*
• 最近一次消费时间间隔(Recency):用户最近一次购物到2017年12月4日的差值
*
• 消费频率(Frequency):用户在2017年11月25日到12月3日的购买次数
*
• 消费金额(Monetary):数据集中没有金额,所以消费金额不分析

1)计算RFM指标,创建RF指标统计视图

在这里插入图片描述

2)给R、F指标按价值打分

确定RF打分标准,给每个用户打分并创建用户RF打分表视图

确定打分标准
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

RF打分统计表

3)计算RF平均值

在这里插入图片描述##### 4)按照RFM用户分类规则给用户分类
在这里插入图片描述*注意:将最近一次消费时间短和消费金额高的分为A级客户,最近一次消费时间长和消费金额低的分为C级客户(快流失或者已经流失),其他属于B级中间客户。
根据RF值创建RF价值分类表视图:
在这里插入图片描述
根据RF价值分类表创建用户价值分类表视图:
在这里插入图片描述
统计不同等级和价值的用户人数:
在这里插入图片描述
结论:淘宝平台在2017.11.25-12.03期间活跃用户983位,下单用户681位占比69.3%。其中A/B等级用户474位占下单用户69.6%,占比良好。重要/一般价值客户占下单用户24.67%;重要/一般发展客户306位,占44.9%,这部分占比最大;重要/一般挽留客户占27.2%;重要/一般保持客户占1.76%。根据不同价值和等级的客户采取不同的营销策略,精细化运营。对占比最大的客户群要重点培养。

5.1.6 用户的复购率

计算复购率:在某时间窗口内重复消费用户(消费两次及以上的用户)在总消费用户中占比
在这里插入图片描述
在这里插入图片描述

结论:淘宝用户整体复购率有66%,淘宝用户留存表现良好。

5.2 从产品维度分析

5.2.1 淘宝平台产品的成交情况

统计被购买过的商品数量
在这里插入图片描述

从5.1.1中得到商品总数64440,被购买过的商品仅仅占3.26%。大量商品处于无人问津的状态。要优化平台商品,推动入驻商家激活沉睡的商品。

5.2.2 产品被点击/收藏/加购/购买的情况

统计不同产品类目被点击的次数、被放入购物车的次数、被收藏的次数、被购买的次数
在这里插入图片描述

对上面列进行相关性分析:
在这里插入图片描述
相关性分析
在这里插入图片描述

回归分析
从相关性分析表和回归分析图可以看到,商品被购买次数和商品个数、被点击次数、被收藏次数、被加购次数都有弱相关性,其中商品个数、被点击次数、被收藏次数、被加购次数都有强相关性。结论:商品类目下的的商品个数越多,点击量越多。结合上面客户主要路径点击-购买,增加商品个数,提高点击量,才能提高客户购买数量。

六、结论和建议

6.1 结论

1)用户在一天中最活跃的阶段是19:00-凌晨1:00,其中21:00-23:00达到最高峰。
2) 用户使用淘宝的时间越长,转化成购买行为的几率越高。初次浏览到初次购买的平均转化周期是3天。
3)淘宝的用户留存率非常好。整体复购率有66%。
4)淘宝用户偏好行为少的购买模式,点击-购买是用户最喜欢的路径,但是转化率过低。点击-购买的转化率低有2种原因:一是平台推荐的准确率低,推送的产品和用户偏好的产品不一致;二是没有爆款,大部分已售产品销量低,不能吸引用户信任和购买。
5)平台上商品类目下的的商品个数越多,点击量越多。结合用户主要的路径点击-购买模式,增加商品个数,提高点击量,能提高客户购买数量。
6)平台上被购买过的商品仅占3.26%。大量商品处于无人问津的状态。要优化平台商品,推动入驻商家激活沉睡的商品。
7)10万数据中,2017.11.25-12.03期间在平台的活跃用户983位,下单用户681位占比69.3%。其中A/B等级用户474位占下单用户69.6%,占比良好。重要/一般价值客户占下单用户24.67%;重要/一般发展客户306位,占44.9%,这部分占比最大;重要/一般挽留客户占27.2%;重要/一般保持客户占1.76%。

6.2 建议

1)在一天中用户活跃度低的时间段做促销预告,提升活跃度高的时间段的购买率。
2)建立用户打卡激励制度,通过奖励吸引客户长期打卡,提高用户的活跃度,最终提高购买率。
3)优化平台推送产品的规则,提高产品推送的准确率。通过数据库精准分析用户画像,力求把用户最需要的产品展现给客户,打造爆款产品积极引流提高店铺其他产品的购买量,从而提高点击-购买的转化率。
4)优化平台商品,优化产品推荐规则,积极培训卖家对店铺的运营。要促进卖家对上架产品的优化,提高产品介绍的完整度、图片清晰度、关键词匹配度,丰富产品明细,下架粗糙产品,激活沉睡商品。
5)对不同价值和等级的客户采取不同的营销策略,按照下面的方法精细化运营。对占比最大的客户群要重点培养。淘宝用户占比最大的是重要/一般发展用户,采用促销互动,提供优惠券等方式提高用户的使用频率;增加品牌商品和优质店铺的推广,提升用户的消费,促进转化。
*
• 重要价值客户(A):优质客户,提高满意度
*
• 重要发展客户(A):购买频率低,提高购买频率
*
• 重要保持客户(B): 最近无购买行为,主动联系,促进用户购买,以防流失
*
• 重要挽留客户(B):潜在的价值客户,重点挽留
*
• 一般价值客户(B):忠诚用户,消费金额低,引导进行消费升级
*
• 一般发展客户(B):新用户,利用低门槛优惠券,组合优惠券吸引提高使用频率
*
• 一般保持客户©: 购买频率高,最近无消费和消费金额低,不在优先级上
*
• 一般挽留客户©:流失用户,短信联系,推送优惠等召回用户

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值