用Hive+Hadoop集群实现《飞机票购买人群分类案例》思路+代码 (实验数据待整理)

本文介绍了通过Hive进行数据预处理,利用LRFMC模型(客户关系长度、消费时间间隔、消费频率、飞行里程、折扣系数平均值)对航空公司客户进行分类的方法。首先,数据清洗去除异常值,然后属性规约保留关键指标,最后通过数据变换计算LRFMC各指标,为后续的客户价值分析和营销策略制定提供依据。
摘要由CSDN通过智能技术生成


1. 思考:我们为什么要做《飞机票购买人群分类案例》?


当今社会,事事存在竞争,航空公司也不例外。想要从林立的航空公司中立足,就要有稳定且增长的盈利。

怎么保证这个盈利呢?这就要从营销策略上下手了,针对不同的客户采取不同的营销策略,才能保证最大的盈利。

那怎么找出不同的客户群呢?这就是这篇文章首先要探索的。


整体思路如下:1.根据航空公司的客户数据,对客户进行分类。

                            2.对不同的客户类别进行特征分析,比较不同类客户的客户价值。

                            3.对不同价值的客户类别提供个性化服务,制定相应的营销策略。


2.航空公司客户价值的LRFMC模型是什么?五个指标是什么?


LRFMC模型:

L:客户关系长度 = 会员入会时间距观测窗口结束的月数

R:消费时间间隔 =  客户最近一次乘坐公司飞机距观测窗口结束的月数 

F:消费频率 = 客户在观测窗口内乘坐公司飞机的次数

M:飞行里程 = 客户在观测窗口内累计的飞行里程

C:折扣系数的平均值 = 客户在观测窗口内乘坐舱位所对应的折扣系数的平均值



实验步骤如下:

启动Hadoop集群,myhql,hive,上传数据到/root/目录。

=============================================================================================

用Hive做数据预处理:

步骤如下:

1) hive -f create_air_data_base.hql  创建表


create table air_data_base(
member_no string,
ffp_date string,
first_flight_date string,
gender string,
ffp_tier int,
work_city string,
work_province string,
work_country string,
age int,
load_time string,
flight_count int,
bp_sum bigint,
ep_sum_yr_1 int,
ep_sum_yr_2 bigint,
sum_yr_1 bigint,
sum_yr_2 bigint,
seg_km_sum bigint,
weighted_seg_km double,
last_flight_date string,
avg_flight_count double,
avg_bp_sum double,
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值