多年以来电子商务业务快速发展,尤其是移动客户端发展迅猛,移动互联网时代的到来让原本就方便快捷的网上购物变得更加便利,而淘宝作为国内最大的电商交易平台更是具有巨大的流量优势。淘宝APP的功能日益复杂,但都离不开最基本的收藏、购物车和购买功能,本文利用sql、Tableau对淘宝用户行为数据进行分析,通过用户行为分析业务问题。
一. 提出问题
“用户行为分析”已经解答了AARRR漏斗模型分析的问题以及不同时段用户的行为数据分析。这里再做两个问题延展,作为本数据集运用分析的结尾。
分别为:
1.找到用户对商品的偏好,找到针对不同商品的营销策略
2.找出最具价值的核心付费用户群,对这部分用户的行为进行分析(RFM模型分析)
问题:
1.找到用户对商品的偏好,找到针对不同商品的营销策略
统计所有商品的购买次数,同时找到购买次数、浏览次数、收藏次数和加入购物车次数最多的商品。
SELECT item_id,COUNT(uid) AS 'times' FROM user_behavinor WHERE b_type='点击' GROUP BY item_id;
SELECT item_id,COUNT(uid) AS 'times' FROM user_behavinor WHERE b_type='收藏' GROUP BY item_id;
SELECT item_id,COUNT(uid) AS 'times' FROM user_behavinor WHERE b_type='加购' GROUP BY item_id;
SELECT item_id,COUNT(uid) AS 'times' FROM user_behavinor WHERE b_type='购买' GROUP BY item_id;
在本次统计的数据中,共有701611种。其中,只点击一次的产品519960种,占到76.79%;点击了两次的产品有98491种,占到14.55%。这说明商品浏览量的增长主要依靠长尾商品的累积效应,而非爆款商品的带动。
点击前20名,品类112921337点击了129次,97655171点击了121次,其余均在100次以下。
列出销量前20位的商品,item_ID为127247596、303205878的商品购买次数最高,为6次。
我们看到收藏数最高的商品为33254436、83098075、374214353,收藏数为5。进一步分析,销量最高的商品没有进入收藏前20名,说明这些吸引用户更多注意力的商品没有很好的转化为实际销量。
在加入购物车次数最多的前20个商品中,可以看到加购第一而不是销量第一,说明加购数与销量的关系并不是很明显直接。(这里截取的数据104万条,截取时段为一个月,可能存在数据量不足或者截取不够的原因,加大数据量可能关系会更明显)
2.基于RFM理论找出有价值的用户
2.1我们首先统计出用户购买商品的最大值和最小值
数据源中没有相关的金额数据,因此通过 R 和 F 的数据对客户价值进行打分。
R-最近购买时间
用户数据的时间范围为一个月,最近购买时间的区间为0-30,将其分为5档,0-6,7-12,13-18,19-24,25-30分别对应评分0到4;
F-消费频率
付费用户中消费次数从低到高为1-15次,将其分为5档,1-3,4-6,7-9,10-12,13-15分别对应评分0到4
CREATE VIEW pay_E AS
SELECT uid,DATEDIFF('2014-12-18',MAX(dates)) AS B , COUNT(*) AS A
FROM user_behavinor WHERE b_type='购买' GROUP BY uid;
###创建视图
SELECT uid, (CASE WHEN B BETWEEN 25 AND 30 THEN 0
WHEN B BETWEEN 19 AND 24 THEN 1
WHEN B BETWEEN 13 AND 18 THEN 2
WHEN B BETWEEN 7 AND 12 THEN 3
WHEN B BETWEEN 0 AND 6 THEN 4 ELSE NULL END) AS R,
(CASE WHEN A BETWEEN 1 AND 3 THEN 0
WHEN A BETWEEN 4 AND 6 THEN 1
WHEN A BETWEEN 7 AND 9 THEN 2
WHEN A BETWEEN 10 AND 12 THEN 3
WHEN A BETWEEN 13 AND 15 THEN 4 ELSE NULL END) AS F
FROM pay_E
ORDER BY R DESC,F DESC;
将R和F的评分合并后结果:
uid | R | F |
110976685 | 4 | 4 |
102825286 | 4 | 4 |
35389479 | 4 | 4 |
71714329 | 4 | 4 |
1926899 | 4 | 4 |
20379505 | 4 | 4 |
4120403 | 4 | 4 |
50244004 | 4 | 3 |
85336332 | 4 | 3 |
4361577 | 4 | 3 |
138735272 | 4 | 3 |
110883373 | 4 | 3 |
109613455 | 4 | 3 |
33797179 | 4 | 3 |
79253885 | 4 | 3 |
14281644 | 4 | 3 |
22393155 | 4 | 3 |
17821367 | 4 | 3 |
(共4430行,列出部门)
从R时间间隔饼图可以看出,间隔评分在4分的占到了47.04%,共计2037人,趋近于一般人数。说明消费者在消费间隔上较小,消费频率集中。从侧面也看出,消费者对消费的热度很大,兴趣很高。除4我i,评分3的人数达到707人,约占16.33%,评分2的人数有666人,约占15.38%。2分和3分人数共有约31.71%,这部分消费群体时间间隔在半个月左右,是处于中等消费频率的区间。针对这部分人群,应该细化市场,将消费者消费兴趣提高,比如可以做一些活动游戏,或者消费优惠活动,让消费者可以累积消费,提高热度。
F纬度评分,位于评分0的人数最多,占到了82.56%。说明购买次数在1-3次的人数是最多的。考虑到消费水平的约束以及消费习惯的固定,这部分消费分析是较为合理的。评分1的人数在561,占到12.99%,位于第二位。这部分人群消费频率在4-6次,处于中等水平。这部分人群是应该加以重要挖掘的客户,应该重点加深精准活动推送,优惠券发放,节假日活动提醒等,提高消费者消费频率。
2.2 R、F 维度综合评分进行用户价值分层
###R、F综合打分
# RF综合打分
CREATE VIEW dafen AS
SELECT uid, (CASE WHEN B BETWEEN 25 AND 30 THEN 0
WHEN B BETWEEN 19 AND 24 THEN 1
WHEN B BETWEEN 13 AND 18 THEN 2
WHEN B BETWEEN 7 AND 12 THEN 3
WHEN B BETWEEN 0 AND 6 THEN 4 ELSE NULL END) AS R,
(CASE WHEN A BETWEEN 1 AND 3 THEN 0
WHEN A BETWEEN 4 AND 6 THEN 1
WHEN A BETWEEN 7 AND 9 THEN 2
WHEN A BETWEEN 10 AND 12 THEN 3
WHEN A BETWEEN 13 AND 15 THEN 4 ELSE NULL END) AS F
FROM pay_E
ORDER BY R DESC,F DESC;
##1.先创建打分视图
##2.创建综合视图
CREATE VIEW rf_score AS
SELECT uid AS '用户ID',R AS 'R维度评分',F AS 'F维度评分',(R + F) AS 'RF维度综合评分'
FROM dafen;
# RF维度综合用户评分
SELECT (CASE WHEN RF维度综合评分 BETWEEN 1 AND 3 THEN '易流失用户'
WHEN RF维度综合评分 BETWEEN 4 AND 5 THEN '挽留用户'
WHEN RF维度综合评分 BETWEEN 6 AND 8 THEN '发展用户'
ELSE '忠诚用户' END ) '用户分层',COUNT(*) '用户数量'
FROM rf_score
GROUP BY 用户分层;
结果如下:
分析:
1、将R维度评分+F维度评分=RF综合评分的指标,
客户分类 | 评分 |
---|---|
易流失用户 | 1-3分 |
挽留用户 | 4-5分 |
发展用户 | 6-7分 |
忠诚用户 | 7分以上 |
如图,可以看出,大部分用户集中在易流失用户和挽留用户上,共计占到了86.35%。
这里,借鉴数据分析猴子一书中的RFM模型分析措施:
客户分类 | 表现 | 措施 |
---|---|---|
易流失用户 | 消费时间距离近,消费频率低 | 提高消费频率、发放短期小额优惠券 |
挽留用户 | 消费时间距离远,消费频率低 | 联系用户,调查挽回 |
发展用户 | 消费时间距离远,消费频率高 | 邮箱推送,app提醒,促销 |
忠诚用户 | 消费时间距离近,消费频率高 | 提高vip服务 |
最后,借鉴数据分析猴子一书中的RFM模型解释图:我们得知用户的RFM分数,用户ID110976685、102825286、35389479、71714329、1926899、20379505、4120403的R、F均是4分,是体系中的最有价值用户,需要重点关注,并且活动投放时需谨慎对待,不要引起用户反感。对于R值为4而F值为0的用户,用户粘性不强而消费时间间隔较短,运营活动可以重点针对这部分用户,提高用户使用产品的频率,可以通过拼团打折、积分兑换等活动唤起用户注意力。
我们提取出评分最高的用户110976685行为数据,发现该用户几乎每天都产生了点击和收藏行为,而购物车的使用频率非常低,为0次。考虑到这是双十一刚刚过去一周左右,用户的购买热情与商家的优惠活动接近结束末期,用户的购物出现短暂的高涨期,随后会逐渐趋于正常。对此,可以根据该用户的活跃规律进行相关活动的推送,由于商品种类数据为脱敏数据,此处无法分析该用户购买的商品类型。
五. 结论与建议
本文分析了淘宝APP用户行为数据共104万条,从两个角度提出业务问题,和BFM模型分析数据给出如下结论和建议。
1.找到用户对不同种类商品的偏好,找到针对不同商品的营销策略
商品售卖主要依靠长尾商品的累积效应,而非爆款商品的带动。销量最高的商品浏览数都没排进前20位,而浏览次数最高的商品甚至没有进入销量前20,说明这些吸引用户更多注意力的商品没有很好的转化为实际销量。
针对浏览量高而销量不高的这部分商品,需要提高的是用户从点击进入商品详情页到最终购买的体验。作为商家端可以从以下几个方面提高销售额:
(1) 商品详情页的实际价格是否相比展示价格偏差过大,有的商家为了吸引用户点击在商品展示页投放的价格具有较强吸引力,但实际价格偏高,在用户心中反而引起反感
(2)详情页的信息流展示是否合理,是否将用户最想看到的部分置于容易看到的位置,便于信息的获取
(3)优化商品展示的形式,利用视频等方式给用户更直观的感受,提高照片的美观程度
(4)评论区评价管理,尤其对于差评区的用户反馈进行认真对待,提高自身服务质量
2.通过RFM模型找出最具价值的核心付费用户群,对这部分用户的行为进行分析
R和F评分都很高的用户是体系中的最有价值用户,需要重点关注,并且活动投放时需谨慎对待,不要引起用户反感。对于R值为4而F值为0的用户,用户粘性不强而消费时间间隔较短,运营活动可以重点针对这部分用户,提高用户使用产品的频率,可以通过拼团打折、积分兑换等活动唤起用户注意力。