RFM分析--spss操作
RFM模型由三个基础指标组成:
R:最近一次消费至今的时间
F:一定时间内重复消费频率
M:一定时间内累计消费金额
RFM模型里,三个变量的含义是很具体的:
M:消费越多,用户价值越高,越应该重点关注。
R:离得越远,用户越有流失可能,越应该唤醒用户。
F:频次越低,越需要用一次性手段(比如促销、赠礼),频次越高,越可以用持续性手段(积分) 来维护
优点:
可以对客户群体进行细分
缺点:
它仅仅考虑了用户的行为数量,没有考虑用户在干什么。比如用RFM考察用户消费,就少了一个关键内容:用户买的是啥。同样的RFM数值,可能情况完全不一样,比如:
R:距今30天未消费
F:最近1个月仅1次消费
M:1000元
在RFM分类里,符合上述条件的是同一类客户。可是:
A用户:趁大促销,囤了1000元洗发水、沐浴露、护发素、纸巾
B用户:趁大促销,买了个1000元的空调
步骤:
首先,将各要素放入变量框。日期要求是日期型变量,yymmdd是年月日
分箱:嵌套。 在嵌套分箱化中,简单等级被分配到上次消费时间值。在每个上次消费时间等级中,客户会分配到一个频率等级,然后在每个频率等级中,客户会分配到一个消费金额等级。这可以使合并 RFM 得分的分布更平均,但其缺点是会使频率和消费金额等级得分更难解释。例如,拥有上次消费时间等级 5 的客户的频率等级 5 与拥有上次消费时间等级 4 的客户的频率等级 5 意义是不同的,因为频率等级取决于上次消费时间等级。
独立。 简单等级被分配到上次消费时间、频率和消费金额值。三个等级独立分配。三个 RFM 组件中每个组件的解释因此都非常明确;一个客户的频率得分 5 与另一个客户的频率得分 5 意义是相同的,无论其上次消费时间得分如何。对于较小的样本,这样做的缺点是会导致合并 RFM 得分的分布不平均。
输出全选
结果:
RFM分箱计数图,蛮漂亮,这个可不是看是不是漂亮的。我们期望是每个格子里面的条图频数均匀分布,也就是差不多高,如大抵上能满足,则说明数据是适合的。
会得到R.F.M三个角度的评分,重新编码为不同的变量。会产生新的分组。之后需要根据不同的组合标记出不同的数字,这些数字都在一列中,分别对不同的值进行定义。排序,就可以对客户进行划分
注:计算变量处,公式的右端就是在列中的表达方式,如果是筛选条件
modeler操作:
RFM分析,首先我们会读取数据内容,然后通过类型节点再对数据内容进行读取。
第三步就是连接rfm汇总节点,该节点中有一个计算,相对于此日期的近期,如果选择固定日期,则输入一个日期以后,每次的日期都是这一个。如果输入今天的日期,那么数据中的日期与今天的日期相减,是动态变化的。
如果你不知道你的数据有没有经过预先排序,那么你就不要选择标识连续。
标识就是选择用来区分的变量
日期选择相应字段
值字段只用来放入金额字段,新的字段名扩展适用于描述我们即将产生的段
丢弃具有以下值的记录。意思就是,如果有这些数将会被舍弃掉。
只包含最近交易,如果原始数据中日期的周期比较长,计算最近一段时间的数据,那么可以在这里通过以下日期后的交易日期以及最近的交易,然后来进行时间限制。
然后再选择rfm分析节点来计算每个客户的rfm得分,在设置面板当中分别对应好相应的字段
设置每个指标的分级数,默认范围是2到9,该分级主要是对每个指标进行离散化划分,按照同等级数方式进行离散化设置。
每个指标的宽度就是权重哪个字段最重要。然后我们就会对他进行相应的计算,最后的RFM的排序就是100×R、F、M和10×R、F、M和+R、F、M。
结,就是指定如何分级相同的评分。
我们可以把它添加到下一个
处于最新状态,将值保存在当前的分级当中
可以减少创建的分级总数
将离群值添加到最终分级,如果选择此况,那么可将离群值分别添加至最高或者最低的级别当中,否则会将控制分配给这些记录
分级阀值是在节点执行过程中是始终重新计算还是加入新数值后再重新计算(如果可用)
在分级值面板当中,我们可以根据前面设置的内容,然后来进行分级值设置更新之后,通过读取值来更新分级值,我们对最后的评分进行排序,就可以得到客户列表