Datawhale【用Python学会员数据化运营】Part2

来填坑啦~Part 1中会员数据化运营分析模型里斜体的内容

基于属性的方法

基于会员属性的细分,可以直接利用现有会员数据库数据,无需做二次开发和计算。

ABC分类法

类似于二八法则,但是更强调分清主次而非抓住关键。

  • A类因素:发生累积频率为0%-80%,是主要影响因素。
  • B类因素:发生累积频率为80%-90%,是次要影响因素。
  • C类因素:发生累积频率为90%-100%,是一般影响因素。

聚类法

是常用的非监督方法,只需要制定要划分的群体数量即可。
非监督方法指分类不需要先前经验,只需要靠数据本身的相似性进行分类即可。

RFM模型

该模型是根据会员 最近一次 购买的时间R(Recency)、购买频率F(Frequency)、购买金额M(Monetary)计算出RFM得分,通过这3个维度来评估客户的订单活跃价值,常用来做客户分群或价值区分。该模型常用于电子商务(即交易类)企业的会员分析。
可以看到该模型与时间有很紧密的关系。

基本实现过程

(1)设置要做计算时的时间节点,用来做基于该时间的数据选取和计算。
(2)在会员数据库中,以今天为时间界限向前倒推固定周期,得到包含每个会员的会员ID、订单时间、订单金额的原始数据集。
(3)数据预处理。从订单时间中找到各个会员距离截止时间节点最近的订单时间作为最近购买时间 ;以会员ID为维度统计每个用户的订单数量作为购买频率;将用户多个订单的订单金额求和得到总订单金额。由此得到的R、F、M原始数据。
(4)R、F、M分区。对于F和M变量来讲,值越大代表购买频率越高、订单金额越高;但对于R来讲,值越小代表离截止时间节点越近,因此值越好。对R、F、M分别使用五分位(三分位也可以,分位数越多划分的越详细)法做数据分区。需要注意的是,对于R来讲需要倒过来划分,离截止时间越近的值,划分越大。这样得到每个用户的R、F、M三个变量的分位数值。
(5)将三个值组合或相加得到总的RFM得分。有两种计算方法,一种是直接将三个值拼接在一起,例如RFM得分为312、333、132等。另一种是直接将三个值相加,求得一个新的汇总值,例如RFM得分为6、9、6。 在得到不同的会员的R、F、M后,根据步骤5产生的两种结果,便可以进行应用了。

两种应用思路

思路1:基于三个维度值做用户群体划分和解读,对用户的价值度做分析。例如得分为212的会员往往购买频率较低,针对购买频率低的客户应该定期发送促销活动的邮件;得分为321的会员虽然购买频率高,但是订单金额低,这样的客户具有较高的购买粘性,可以考虑通过关联或者搭配销售的方式提升订单金额。

思路2:基于RFM的汇总得分评估所有会员的价值度情况,并可以进行价值度排名。同时,该得分还可以作为输入维度与其他维度一起作为其他数据分析和挖掘模型的输入变量,为分析建模提供基础。

统计分析
先对整体用户做统计分析,包括描述性分析,频数分布等了解整体数据概括。

下篇为实战篇,尽请期待吧~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值