1.背景方面
准确的客户分类的结果是企业优化营销资源的重要依据,本文利用了航空公司的部分数据,利用Kmeans聚类方法,对航空公司的客户进行了分类,来识别出不同的客户群体,从来发现有用的客户,从而对不同价值的客户类别提供个性化服务,指定相应的营销策略。
本次数据挖掘与数据分析目标:
(1)借助航空公司数据,对客户进行分类;
(2)对不同类别的客户进行特征分析,比较不同类别客户的价值分析;
(3)对不同价值的客户类别进行个性化服务,制定相应的营销策略。
2.分析过程
识别客户价值应用最广泛的模型是通过3个指标(最近消费时间间隔(Recency)、消费频率(Frequency)和消费金额(Money))来进行客户细分,识别出高价值客户,简称RFM模型。
RFM模型中,消费金额表示一段时间内,客户购买企业产品金额的总和。由于航空票价受到运输距离、舱位等级等多种因素影响,同样消费金额的不同旅客对航空公司的价值是不同的。例如,一位购买长航线、低等舱位票的旅客与一位购买短航线、高等级舱位票的旅客相比,后者对于航空公司的价值可能更高。因此,这个指标并不适合航空公司客户价值分析。我们选择客户在一定时间内累积的飞行里程M和客户在一定时间内乘坐舱位所对应的折扣系数的平均值C两个指标代替消费金额。此外,还考虑航空公司会员入会时间的长短在一定程度上影响客户价值,所以在模型中增加客户关系长度L,作为区分客户的另一指标。
综上所述,航空公司识别客户价值模型(LRFMC)指标如下:
客户关系长度L:会员入会时间距观测窗口结束的月份
消费时间间隔R:客户最近一次乘坐公司飞机距观测窗口结束的月数
消费频率F:客户在观测窗口内乘坐公司飞机的次数
飞行里程M:客户在观测窗口内飞行里程
折扣系数的平均值C:客户在观测窗口内乘坐舱位所对应的折扣系数的平均值
传统的RFM模型采用属性分箱的方法,如下图所示(依据属性的平均值进行划分),虽然也能识别出最有价值客户,但是如果LRFMC模型使用同样的方法,则细分的属性太多,提高了后续根据客户类别的营销成本。故本次分析使用聚类方法,通过对航