1.需求:
1.1 数据采集
一、 数据源 1 1(交通运输)
航空出行由于它的快捷便利,已经被越来越多的人喜欢,某航空公司通过
多年运营,积累了大量会员档案和乘坐航班信息,为对客户进行分群,明确价
值客户群体,将有限的营销资源集中于高价值客户,实现企业利润最大化。为
此,该航空公司聘请“H3CU”大数据分析公司完成此项目。
由于会员信息属于公司机密数据,该航空公司将数据脱敏后以 csv 文件传
送给“H3CU”公司进行数据处理与分析,为安全考虑“H3CU”公司需将数据
先存入数据库中备份,再进一步数据清洗与分析。请参考一下相关专业说明完
成任务。
1、 航空公司积累了大量会员档案信息和乘坐航班信息,其中包含了会员卡号、
GZ-2019032 大数据技术与应用(高职组)赛题库
- 13 -
入会时间、性别、年龄、会员卡级别、在观测窗口内的飞行公里数、飞行时
间、飞行次数等 44 个特征属性,数据存放在 csv 格式文件中。
2、 识别客户价值应用最广泛的模型是 RFM 模型。其中,R(Recency)指的是
最近一次消费时间与截止时间的时间间隔,通常 R 值越小,客户对商品或服
务最可能感兴趣。F(Frequency)指顾客某段时间的消费次数,次数越高,
顾客价值越大。M(Monetary)指顾客在某段时间内的消费金额。
3、 由于在本任务中,同样消费金额的不同客户,对航空公司的价值是不同,比
如,一位购买长航线、低等级舱位的旅客与一位购买短航