之前的一篇博客介绍了关于航空公司客户价值分析,今天的这篇博客将对航空公司的客户的流失进行预测。采用的是相同的数据集。
1. 背景
客户流失对企业利润的增长造成的负面影响很大。客户与航空公司之间的关系越长久,给公司带来的利润就会越高。所以,流失一个客户比获得一个新客户对公司带来的损失更大,因为要获得新客户需要再销售、市场、广告和人员工资等方面花费很多的成本,并且大多数新客户产生的利润并不如老客户高。
因此,在国内航空市场竞争日益激烈的背景下,航空公司在客户流失方面应该高度重视。本次项目的目的是根据航空公司的数据对老客户的流失做出预测。
2. 建模前
客户流失预测主要针对老客户。这里的老客户的界定是飞行次数大于 6 次。
2.1 类别标记
接下来给老客户打标签,将第二年飞行次数与第一年飞行次数相比比例小于50%的标记为流失客户,记为 1;将第二年飞行次数与第一年飞行次数相比比例大于等于50%的标记为非流失客户,记为 0。
用Python实现的方法如下:
airline['class'] = airline['L1Y_Flight_Count'] / airline['P1Y_Flight_Count']
def class(x):
if x >= 0.5: return 0
else