在互联网飞速发展的当下,电商零售业兴起,如何从海量的数据中获得有用的信息以增加流量,改进销量,无论对平台还是商家都有着重要的意义。本文选取天池上的淘宝用户行为数据集,时间位于2014年11月18日到12月18日之间。
本文分别从用户(人)、商品(货)这几个角度分析,其中包含用户活跃度、用户转化率、商品的点击次数、收藏/加购次数、购买次数等指标,其中重点分析用户行为,对用户分进行分层分析,输出策略15条。
一、数据概览与处理
数据集有100w+条记录,包括以下几个字段:
数据集总共包含用户(id与行为)、商品(id与类别)和时间这三个维度,数据集较为干净,无空值。接下来对数据进行必要的类型转化,以及日期与小时的时间数据分隔,处理后的数据概览:
二、用户
可看出不同用户行为存在一定的时间规律(日趋势,时趋势,双十二)
故可从时间角度对比分析以下几个指标的关系:
用户活跃度(访客量):
pv(pageview):用户每刷新一次就算做一次访问量
uv(uniqueview):对每条重复的用户访问记录进行去重
交易转化率:
click_to_pay:点击-购买转化率(用户的购买次数/点击次数)
fav_add_to_pay:收藏/加购-购买转化率
(1)用户活跃度与转化率
通过对比分析不同时间的访客量与转化率,得出如下策略:白天增加广告投放量,进行促活;双十二前开展大幅度的促销、推广活动;双十二当天零点推出限时折扣,优惠补贴。
1、日趋势:
访客量与转化率在双十二达最高峰,而转化率在双十二前夕达最低点,推测用户将商品囤积到双十二购买
商家可以考虑在双十二前开展大幅度的促销、推广活动
2、时趋势
访客量在晚上10点达最高峰,交易转化率的峰值在上午10点,可推测用户多喜欢在晚上刷淘宝,在白天点击、下单
商家可以在白天增加广告投放量,进行促活
3、双十二
总体的转化率:
双十二当天的转化率:
双十二的转化率是平时的两倍,当天的访客量、转化率变化:
访客量和平时一样,但交易转化率多了零点这个最高峰
商家可以在双十二当天零点推出限时折扣,优惠补贴
(2)用户分层
对用户商业价值进行分析,将用户分为七大类,根据日趋势、时趋势,得出双十二对各类用户的影响,以及各类用户在哪个时间段交易转化率最高,输出针对性策略15条:
分类借鉴RFM模型的指标描述客户的价值
1.分层依据
RFM模型是衡量客户价值和客户创造利益能力的重要工具,划分指标为:
一个客户的近期购买行为(R):
上一次消费时间越近的顾客,对提供即时的商品或是服务也最有可能会有反应。最近一次消费距现在的时间间隔,衡量了用户的记忆度
购买的总体频率(F):
最常购买的顾客,也是满意度最高的顾客,该指标衡量了用户的忠诚度。
消费金额(M)
由于本文未涉及到消费金额,故而通过R、F的值对用户分层
而这些阈值取决于业务经验,受制于数据,本文先观察R、F的分布情况
R、F的统计描述和异常值分布如下所示:
R表现较为稳健,可对R用均值进行划分,分为 [0,10)、[10,30] 两个区间
F存在明显的异常值,由于均值受异常值影响较大,故对F采用四分位数进行划分,且从密度分布可以看出大部分数据都位于10以内,故分为 [1,2),[2,3),[3,82] 三个区间
将用户分为以下七类:
2.不同用户类别的行为对比
各用户类别占比情况:
未消费过的客户占比最大(30.5),其次是重要价值用户(26.7%)、一般保持用户(13.0%)、新客户(10.2%)、重要召回用户(5.9%)和一般挽留用户(5.1%)
各类别用户的不同行为(2收藏/3加购/4购买)比率:
重要价值用户的加购/购买比率最高,重要召回用户的收藏比率最高,一般挽留和重要发展用户的收藏/加购/购买比率位于中间,而一般保持、未消费过的客户和新客户的加购/购买比率最低
因此,对重要价值用户(26.7%),可以重点关注和保持,提高用户满意度,增加用户留存率; 对重要发展用户(8.6%)和一般挽留用户(5.1%),需要提高购买频率。
3.各用户类别行为的时间规律
日趋势:
用户行为:
重要价值用户与重要发展用户,均在双十二前保持平缓,双十二激增,后降至原来水平,其中重要发展用户的波动幅度较大
重要召回用户的加购/购买数量在双十二当天出现小幅增长,但总体趋势为下降
新用户在有购买行为之后,变化趋势和价值用户、发展用户一致
转化率:
各类别用户点击-收藏/加购转化率表现平缓,重点分析收藏/加购-购买转化率、点击-购买转化率
重要价值用户:双十二点击-购买转化率有小幅增幅;双十二后收藏/加购-购买转化率稍有增加
分析:该用户已经是平台的稳定用户,保持客户
策略:提供个性化vip优质服务
重要发展用户:双十二点击-购买转化率有小幅增幅;双十二后收藏/加购-购买转化率出现大幅增加
分析:该用户受双十二购物狂欢节影响较大,可推测该用户喜欢限时优惠、爆款(爱凑热闹)
策略:短信、邮件定期推送优惠与爆品、折扣信息;主动联系,关怀产品使用情况,提供良好的售后服务,增加满意度
重要召回用户:随着时间的推进,收藏/加购-购买转化率从11月18日的最高值,狂铁至0;点击-购买转化率也在双十二前5天跌至为0(双十二前五天起不再购买)
分析:该用户平时有购物习惯,但不喜欢在双十二期间购物,可推测用户受物流等因素影响较大,对能不能即时收到货比较敏感,而对爆款敏感度较低
策略:推送个性化的激励活动;主动联系客户,开展问卷调查,根据用户反馈制定个性化营销策略,例如发送大额优惠卷
新客户:收藏/加购-购买转化率从双十二前5天开始大幅增长,甚至高于价值用户和发展用户
分析:该用户有较大的发展潜力,应该加大力度发展该用户
策略:0元试用,买一送一;设立门槛优惠方案,提供优惠活动
一般挽留用户与一般保持用户的转化率均在双十二前五天出现断崖式下跌
策略:对于一般用户可以适当减少预算,降低营销成本
未消费过的客户的点击-收藏/加购转化率则和其他用户一样,表现波澜不惊
策略:适当投入营销成本
时趋势:
用户行为:
多数用户的浏览量在晚上出现大幅增加,消费量在夜晚出现小高峰
转化率:
各类别用户点击-收藏/加购转化率、点击-购买转化率表现平缓,故只分析收藏/加购-购买转化率:
重要价值用户/重要发展用户:出现两个峰值,一个在凌晨,另一个在中午11点,转化率在白天较长一段时间保持在高位
重要召回用户:转化率在中午11/12点达到最大值, 白天较长一段时间保持在高位
一般挽留用户:转化率变化趋势和召回用户相似,但波动幅度较大
一般保持用户:转化率变化趋势和召回用户相似,但白天较短一段时间保持在较高水平,总体水平低于召回用户
策略:
对所有用户重点加强白天的营销推广引流力度,其中:
对重要价值用户与重要发展用户:增加凌晨的引流与推广;适当延长白天的推广时长
对于重要召回用户:适当延长白天的推广时长
双十二:
转化率:
各类用户的转化率在双十二变得异常激烈,变动频率加快,其中:
重要价值和重要发展用户:收藏/加购-购买转化率在凌晨将近2小时内保持在高位,其中重要价值用户总体转化率要高于重要发展用户
重要召回用户:点击-购买转化率在凌晨某个时间点保持在高位
新客户:收藏/加购-购买转化率在凌晨2/3点达到最高值
而其他的用户则没有显著的规律
三、商品
查看与商品直接相关的字段(item_id,item_category)的大小:
可知商品个数较多,而类别仅为商品个数的1/10
1、尝试筛选爆品
分别统计点击,收藏/加购,购买的次数,以及次数的排名情况,处理的表格如下:
分别对点击次数、收藏/加购次数和 购买次数进行排名,并绘制其频率图:
可以看出无论是点击次数,收藏/加购次数还是购买次数,他们的分布右偏较为严重。
由于上图无法直观看出分布比率,接下来绘制累积概率分布图:
可以看出无论是点击次数,收藏/加购次数还是购买次数,其排名较前的比率均低于0.2
经查询,点击次数,收藏/加购次数,购买次数排名前20%的记录为空,同时点击次数,收藏/加购次数排名前20%的记录也为空。
这说明各个商品的点击次数、收藏/加购次数、购买次数两极分化较为严重,因此考虑直接用量级最大的点击率,衡量商品的受欢迎程度
用MySQL筛选出点击次数排名前1%的商品,查看点击次数排名前1%的商品中被消费的比重:
点击次数排名前1%的商品中消费占比仅为1%,可见非常受欢迎的商品,实际上人们下单的比率很小
说明人们有购买需求,但经过点击了解后(甚至多方对比),并没有下单。推测这类商品是日常生活必需品,所以人们经常使用,对此类商品有着明确或者较高的需求。
而对于这类极受欢迎的商品,加大推广是隔靴搔痒,对于商家而言,必须深入了解商家不同商品的用户画像,明确用户痛点需求,对不同的用户引流/细分经营