Python数据挖掘-航空公司客户价值分析

该博客介绍了如何利用Python进行航空公司客户价值分析,采用LRFMC模型(入会时间L、最近乘机时间R、飞行次数F、飞行里程M和舱位折扣C)替代传统的RFM模型。通过k-means聚类算法,将客户分为5类,并对各类客户进行了特征分析,识别出重要保持、发展、挽留和低价值客户群体。
摘要由CSDN通过智能技术生成

航空公司客户价值分析
目标:企业针对不同价值的客户制定个性化的服务,将有限的资源集中于高价值客户。
1、借助航空公司的数据进行客户分类
2、比较不同类客户的价值并制定销策略

识别客户价值的最广泛的模型是通过RFM模型来识别出高价值的客户:
Recency: 最近消费时间间隔
Frequency: 消费频率
Monetary: 消费金额
问题:同样的消费金额的不同旅客对航空公司的价值不同,例如买长航线、低等仓的旅客和买短航线、高等仓的旅客消费金额相同
但是价值确实不同的。显然后者更有价值。因此这个指标可能不合适,故选择客户在一定时间内的飞行里程M和乘坐舱位所对应的折扣洗漱C。

航空公司客户价值分析模型:
L:会员入会时间距观测窗口结束的时间
R:客户最近一次乘坐公司分级距观测窗口结束的时间(月数)
F:客户在观测窗口内乘坐公司飞机的次数
M:客户在观测窗口内累计的飞行里程
C:客户在观测窗口内乘坐舱位所对应的折扣系数的平均值
模型概述:
通过使用k-means聚类算法没使用LRFMC模型进行测试
对模型进行分析,分析客户的价值

import pandas as pd
datafile = 'data/air_data.csv'
resultfile = 'data/tmp.xls' 
data = pd.read_csv(datafile, encoding='utf-8')

explore = data.describe().T 
explore['null'] = len(data) - explore['count'] #计算空值


explore = explore[['null', 'max', 'min']]  #得到每一列的空值,最大值,最小值


explore.to_excel(resultfile) # 是结果写入文件

根据上面的数据统计,丢弃所有不符合的数据,
1、票价为空的
2、票价为0,但是折扣不是0,而且飞行里程大于0,
这样的数据是错误数据,直接删除。

data = pd.read_csv(datafile, encoding=
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值