航空公司客户价值分析
1.挖掘背景与目标
开启了第一个数据分析的项目,针对于航空公司价值的分析。客户关系管理的关键问题是客户分类,通过客户分类,区别无价值客户,高价值客户,企业针对不同价值的客户制定优化的个性化服务方案,采取不同的营销策略,将有限营销资源集中于高价值客户,实现企业利润最大化目标。
1)借助航空公司客户数据,对客户分类。
2)对不同的客户类别进行特征分析,比较不同客户的客户价值。
3)对不同价值的客户类别提供个性化的服务,制定相应的营销策略。
2.分析方法与过程
目标是客户价值识别,通过航空公司客户数据识别不同价值的客户,识别客户价值应用最广泛的模型是通过三个指标(最近消费时间间隔(Recency),消费频率(Frequency)和消费金额(Monetary))来进行客户细分,识别出高价值客户,简称RFM模型。
本案例将客户关系长度L,消费时间间隔R,消费频率F,飞行里程M和折扣系数的平均值C五个指标作为航空公司识别客户价值目标,记为LRFMC模型。
航空公司客运信息挖掘主要包括以下步骤。
1)从航空公司的数据源中进行选择性抽取与新增数据抽取分别形成历史数据和增量数据。
2)对步骤1)中形成的两个数据集进行数据探索分析与预处理,包括数据缺失值与异常值的分析探索,数据的属性规约,清洗与变换。
3)利用步骤2)中形成的已完成数据预处理的建模数据,基于旅客价值的LRFMC模型进行客户分群,对各个客户群进行特征分析,识别出有价值的客户。
4)针对模型得到不同的价值的客户,采用不同的营销手段,提供定制化的服务。
2.1数据抽取与探索分析
本案例的探索分析是对数据进行缺失值分析与异常值分析,分析出数据的规律以及异常值。通过对数据观察发现原始数据中存在票价为价值,价值最小值为0,折扣率最小值为0,总飞行公里数大于0的记录。票价为空值的数据可能是客户不存在乘机记录造成,其他的数据可能是客户乘坐0折扣机票或者积分兑换产生的。
查找每列熟悉观测值中空值的个数,最大值,最小值的python代码。
# 对数据进行基本的探索
# 返回缺失值个数以及最大最小值
import pandas as pd
datafile = '../Data/air_data.csv' # 航空原始数据
resultfile = '../Tmp/explore.xls' # 数据探索结果
data = pd.read_csv(datafile, encoding= 'utf-8') # 指定为UTF-8编码格式
print(data)
explore = data.describe(percentiles= [], include= 'all').T
# 对数据的基本描述,percenttiles参数是指定计算多少的分位数表(1/4分位数,中位数)
explore['null'] = len(data) - explore['count'] # describe()函数自动计算非空数值,需要手动计算空值数
explore =