航空公司客户价值分析

1. 背景

高铁、动车等铁路的不断兴建,出行方式的多元化让航空公司受到很大的冲击。航空公司之间竞争也很激烈,除了四大航空公司之间的竞争之外,还有新兴产业的各类小型航空公司、民营航空公司,旅游等。甚至国外航线出现高速度增长。随着时代的发展,客户问题越来越受到关注,客户流失对利润增长造成了非常大的负面影响。客户与航空公司的关系越长,航空公司的利润就越高。一个客户使用了几次这次服务,感觉服务不错,那下次还会倾向于这个服务,但是要获得新客户,不仅需要在广告和人员工资上花费很多,去吸引顾客,在销售、市场也会花费很多,并且大多数新客户产生的利润不如那些流失的老客户多。很明显,失去一个客户对公司来说比得到一个新客户更昂贵。另外老用户也可以带来新用户。因此,在这一背景下,分析航空公司客户数据,对客户进行分类,提高客户流失率是当务之急。航空公司应针对不同类型的客户制定相应的营销模式,以实现利润最大化。

2. 思路

将客户关系长度L、消费时间间隔R、消费频率F、飞行里程M和折扣系数的平均值C五个指标作为航空公司识别客户价值指标,记为LRFMC模型。依据航空公司客户价值分析的LRFMC模型提取客户信息的LRFMC指标。对其进行标准差标准化保存后,采取K-Means算法完成客户的聚类,分析每类客户的客户特征,从而获得每类客户的价值。

1、用Pandas程序,读入LRFMC指标文件,分别计算各个指标的均值和标准差,使用标准差标准化公式完成LRMFC指标的标准化,并将标准化后的数据保存。

2、编写Python程序,完成客户K-Means聚类,获得聚类中心与类标号。输出聚类中心的特征图,并统计每个类别的客户数。

3. 数据预处理

3.1 数据清洗

通过探索分析,发现数据中存在缺失值,票价最小值为0、折扣率最小值为0、总飞行公里数大于0的记录。由于原始数据量大,这类数据所占比例较小,对问题影响不大,因此对其丢弃。处理方法如下:

1、丢弃票价为空的记录。

2、丢弃票价为0、平均折扣率不为0、总飞行公里数大于-的记录。

3、使用Pandas对满足清洗条件的数据所在的一行数据全部丢弃。

3.2 属性规约

原始数据中属性太多,根据航空公司LRFMC模型,选择与该模型相关的6个属性:FFP_DATE、LOAD_TIME、FLIGHT_COUNT、AVG_DISCOUNT、 SEG_KM_SUM、LAST_TO_END。删除与其不相关、弱相关或冗余的属性。

3.3 数据变换

主要采用的数据变换方式为属性构造和数据标准化。由于原始数据中并没有直接给出LRFMC五个指标,需要通过原始数据提取这五个指标,具体的计算方式如下:

(1)L=LOAD_TIME-FFP_DATE

会员入会时间距观测窗口结束的月数=观测窗口的结束时间-人会时间[单位:月]

(2)R=LAST_TO_END

客户最近一次乘坐公司飞机距观测窗口结束的月数=最后一次乘机时间至观察窗口末端时长[单位:月]

(3)F

  • 3
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值