淘宝用户行为分析报告

项目介绍

本次项的目的,为探究淘宝用户的行为,并进行分析。原始数据为淘宝用户,一个月的用户操作记录。数据来源于阿里天池官网。该数据已进行脱敏处理。总数据量为1200万条,包含的字段如下:

user_id	item_id	behavior_type	user_geohash	item_category	time
0	98047837	232431562	1	NaN	4245	2014-12-06 02
1	97726136	383583590	1	NaN	5894	2014-12-09 20
2	98607707	64749712	1	NaN	2883	2014-12-18 11
3	98662432	320593836	1	96nn52n	6562	2014-12-06 10
4	98145908	290208520	1	NaN	13926	2014-12-16 21

本人职责

挖掘数据,并分析用户行为,包括:

  • 这个月中的用户PV和UV的情况如何?
  • 商品的转化率如何分布?
  • 商品的ARPU和ARPPU如何变化?
  • 消费者购买的次数和频率分布?
  • 哪种商品最受消费者青睐?

最后需要对现象给出解释,并对相关的问题提出合理化的建议。本次选择的分析工具为python以及tableau。数据需要进行数据清洗,但在此不过多的赘述。

分析过程

PV和UV的分布情况

每天的分布

通过日期的聚合,来查看每天的PV和UV的变化情况,最后把结果导出。

v_d=pd.DataFrame()
v_d['pv_d']=data.groupby(by='date')['user_id'].count()
v_d['uv_d']=data.groupby(by='date')['user_id'].apply(lambda x:x.drop_duplicates().count())

v_d.to_csv(r'C:/Users/mi/Desktop/v_d.csv')
双十二

要特别注意,PV和UV的Y坐标是不同的,因为PV和UV不是一个数量级,所以在此对PV和UV分别绘图。结果如下图所示:
在这里插入图片描述
通过图表,可以得出以下规律:

  • 12月8号到12月13号之间,PV,UV,以及平均每人每天操作次数(PV/UV),都有一个突然增大的趋势,然后有迅速的滑落到正常水平。从时间点上看,不难推测出,这主要是因为双十二购物节,商家通过各种手段来刺激消费。
    从PV看,而从8号开始,商家就开始铺垫了。12号达到顶峰,然后出现了一次断崖式的下滑,回到了正常水平。
  • 对比UV和PV,UV的变化趋势比较平缓,其一个月最高与最低相差25%,而PV达到了119%!这将近是UV的5倍。由此能得到,商家的活动大幅度刺激了消费
  • 通过平均每人每天操作次数,可以得出,商家的活动提高了活跃度,刺激了消费。
  • 对于双十二的推广活动,能提高了用户的粘度。这里采用的统计量为日UV/月UV,月UV为10000,也就是说这一个月中有10000用户访问过。

通过以上四点分析,能看出双十二对于消费的刺激力度还是很大的。

非双十二

但如果不考虑双十二的推广活动,只看8号之前的状况。不管PV还是UV都呈现出周期性波动。如下图所示:

在这里插入图片描述

在这里插入图片描述
前三个低点,包括了两个完整的周期,而且前三个最低点都是星期五。第四个星期五就是12月12号。所以在星期五的时候,人们的活跃度是比较低的。估计上班,上了一周,身心俱疲,想好好休息一下。

一天内不同时刻

通过时间的聚合,来查看这个月中,每小时PV和UV的变化情况,最后导出结果。

v_h=pd.DataFrame()
v_h['pv_h']=data.groupby(by='hour')['user_id'].count()
v_h['uv_h']=data.groupby(by='hour')['user_id'].apply(lambda x:x.drop_duplicates().count())
v_h['p/u']=v_h['pv_h']/v_h['uv_h']
总体分析

绘制每小时的PV和UV的变化图

在这里插入图片描述
从图中我们不难发现:

  1. 在凌晨4、5点,不管是PV还是UV,都是较低的状态;
  2. 从PV和UV角度看,5点到9点用户是大幅度增加,到9点达到稳定,持续到下午5点。接着PV和UV就有比较大的差别了。晚上6点到10点,PV快速增加,UV则缓慢增长一点;
  3. 从每个人的操作次数可以看出,5点到9点快速增加,9点到下午6点比较稳定,6点以后快速增加,10点以后,快速回落。

以上三点是数据规律的描述,从中可以得到:
凌晨4、5点是人们活跃度最低的时候,这也很好理解,大部分人还在睡觉呢!
9点到下午6点钟,人们活跃度比较稳定,因为大部分人需要上班或者上学,不可能一直刷手机。从6点开始,人们开始下班、放学,活跃度开始逐步攀升,在晚上10点中达到了顶峰。

不同的操作类型

对于用户的操作分成4类,点击、加购、收藏和购买。如下图所示:

在这里插入图片描述

点击占比最大,达到整个操作的90%以上,但更有价值的是后三种类型。毕竟商家是希望你买它的东西,而不是做一个吃瓜群众。所以我们看看后三种类型的变化如何。

在这里插入图片描述通过上图,也能够之前我们所得到的结论,在9点10点的时候用户是比较活跃的,购买的商品次数也是比较多,在此不过多赘述。

商品转化率

每天商品转化率

下图为商品每天转化率的变化情况图。
在这里插入图片描述
双十二,商品的购买率有着大幅度的增加。

一天内不同时刻商品转化率

通过三者的面积图占比,能很好的说明商品的转化率变化情况。在此不考虑商品的点击情况。

在这里插入图片描述

凌晨商品的购买率最低,这也是人们活跃度最低的时候。但购买率最高的却不是,人们最活跃的时候,而是在吃午饭的时候。
猜测是,晚上人们更多的是选择自己感兴趣的商品,但还没有下决心到底剁不剁手。到了中午,一方面经过了一夜的思考,坚定了决心,剁手!另一方面赶上午休,所以转化率相对来说要高一点。

靠前的商品真的是货真价实吗?

根据商品总体情况统计:

  • 有8916种商品,但是客户真正购买过的商品,有4665种。占商品总数52%;
  • 总体用户的点击操作共计1150万次,而购买的次数只有12万;

选择商品

由于商品的种类较多,所以选择点击次数和购买次数前三十的商品。但由于点击次数和购买次数不一定重合,对其进行联合。最终有41种品类的商品,相比较30种虽然有较大的出入,但也有很强的相关性。以下为部分数据:
在这里插入图片描述

商品的点击与购买

以商品的点击次数排序,最下方的柱状图为购买次数,颜色越深代表商品的贡献率越大。对41种商品进行展示,如下图所示:
在这里插入图片描述
对于商品的贡献率,对其进行量化展示。
在这里插入图片描述
通过以上两种图片的展示,我们可以看到以下现象:

  • 不是越热闹的商品,用户就越愿意掏钱;
  • 有些点击率不高,知名度较小的商品,用户却很愿意花钱;
  • 商品的点击量和购买率存在一定的相关性。

对比6344和1863,也就是购买次数第一和点击次数第一的商品。虽然6344商品比1863点击率要高出4.5倍,但两者的购买次数确实极为相近的。甚至6344商品还要高出很多。
由于本次数据中,没有商品的交易额、商品的种类以及单价。无法做出6344商品就要比1863商品要好的结论。如果1863是新发布的手机,而6344是一种牙膏。那么其两者就根本没有对比的意义。

虽然缺失较多信息,但建议:

  • 对于6977商品极有可能是爆款。虽然相比头部,知名度较低,但是知名度也是不错。建议商家了解更多此类商品的信息。如果确实是爆款则加大推广。
  • 对于哪些贡献率为0的以及较低的商品,则同样需要加大关注,如果只是靠打广告,把知名度打上去的。建议平台提醒该商家注重产品的质量和性价比。如果是其他情况,如一款单价较高的产品,虽然买的人不多,但吃瓜群众特别多,则需要采取其他措施。

用户购买的频率和次数

统计数据

通过统计用户这个月中,购买的商品次数及频率得到如下数据。
在这里插入图片描述
根据统计:

  • 有8886位顾客有购买记录,占到这一个月中有访问记录用户的89%;
  • 而购买的次数有12万条;

根据统计数据,绘制出以下图形。
在这里插入图片描述
由此可以看出,不管是商品的频率还是商品的购买数量,都呈现了很明显的长尾分布。特别是商品的购买数量,其中商品的购买数量,最大值达到了900多。为了绘图方便在图中没有体现。

由此得到以下现象:

  • 这个月购买过商品的用户,复购率达到87%;
  • 大部分顾客,购买商品的数量在20件以内。
  • 大部分顾客,购买商品的频率,为每月不超过10次。

根据上述现象给出以下建议:

  • 对于购买次数较多的客户,可以给与更多的优惠,以增加用户的粘度;
  • 对于购买次数特别频繁和数量特别多的客户,需特别注意,是否存在异常;
  • 对于没有购买过商品以及购买次数较少的客户,需要加大推广,以及运营活动;
  • 考虑到本月有双十二活动的影响,可能会对上述结论产生影响。从个人生活角度出发,双十二会产生较大的影响,但这个影响具体由多大,则需要进一步讨论。

项目成果

以上分析,得到以下重要结论:

  1. 用户每天PV和UV是呈现周期性变化,但如果出现较大的促销活动则会被打破;
  2. 双十二对于刺激消费具有很大作用,能大幅度提高用户的活跃度;
  3. 用户和平台有很高的粘度,即便没有双十二;
  4. 一般情况,每天的商品的转化率较为稳定;
  5. 中午时分,消费者的购买概率最大。
  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值