用Python进行航空公司客户价值分析(数据分析)
学习资料:
参考图书:《Python数据分析与挖掘实战》(机械工业出版社)第7章
参考博文:https://blog.csdn.net/a857553315/article/details/79177524
https://www.kesci.com/home/project/5a71818f94eaea7410491462
目标
书中介绍了背景,要求根据背景通过数据挖掘实现如下目标:
- 借助航空公司客户数据,对客户进行分类
- 对不同的客户类别进行特征分析,比较不同客户的客户价值
- 对不同价值的客户类别提供个性化服务,制定相应的营销策略
分析方法和过程
FRM模型(Frequency Recency Monetary)
F:消费频率
R:最近消费时间间隔
M:消费金额
传统的RFM模型分析的属性分箱方法,如图所示。它是依据属性的平均值进行划分,其中大于平均值得表示为向上的箭头(↑),小于平均值的表示为向下的箭头(↓),虽然也能够识别出最具有价值的客户,但是细分的客户群太多,提高了针对性营销的成本。
书中采用了LRFMC模型的五个指标进行K-Means聚类,识别出最有价值的客户。
L:客户关系长度
R:消费时间间隔
F:消费频率
M:飞行里程
C:平均值
为什么选择这五个指标呢?
- 选择客户在一定时间内积累的飞行里程M和客户在一定时间内乘坐舱位所对应的折扣系数的平均值C两个指标代替了消费金额。
- 考虑航空公司会员入会时间的长短在一定程度上能够影响客户价值,所以在模型中增加客户关系长度L,作为区分客户的另一指标。
指标含义:
模型 | L | R | F | M | C |
---|---|---|---|---|---|
LRFMC模型 | 会员入会时间距观测窗口结束的月数 | 客户最近一次乘坐公司飞机距观测窗口结束的月数 | 客户在观测窗口内乘坐公司 |