python数据分析-客户价值分析

目标:企业针对不同价值的客户制定个性化的服务,将有限的资源集中于高价值客户。
1、借助航空公司的数据进行客户分类
2、比较不同类客户的价值并制定销策略
传统上识别客户价值模型是通过RFM模型:
Recency: 最近消费时间间隔
Frequency: 消费频率
Monetary: 消费金额
但是存在问题:
同样的消费金额的不同旅客对航空公司的价值不同,例如买长航线、低等仓的旅客和买短航线、高等仓的旅客消费金额相同
但是价值确实不同的。显然后者更有价值。因此这个指标可能不合适,故选择客户在一定时间内的飞行里程M和乘坐舱位所对应的折扣数C。

本次数据挖掘的主要步骤:

1).从航空公司的数据源中进行选择性抽取与新增数据抽取分别形成历史数据和增量数据
2).对步骤1)中形成的两个数据集进行数据探索分析和预处理,包括数据缺失值和异常值分析。即数据属性的规约、清洗和变换
3).利用步骤2)中的处理的数据进行建模,利用Python下Sklearn库中提供的KMeans方法,进行聚类
4)针对模型的结果进行分析。

数据抽取

数据集抽取2012-4-1到2014-3-31内乘客的数据,以宽度为2年的时间段作为分析观测窗口。

数据探索

explore=data.describe(percentiles=[],include='all').T
explore['null']=len(data)-explore['count']  #手动计算控制数
explore.head()  #显示每个属性的统计值
explore=explore[['null','max','min']]
explore.columns=[u'空值',u'最大值',u'最小值']
explore.to_excel(outputfile)     

数据预处理

import pandas as pd

datafile= 'data/air_data.csv' 
cleanedfile = 'output/data_cleaned.xls' #数据清洗后保存的文件
  • 2
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值