2018
年第
15
期
信息与电脑
China Computer&Communication
软件开发与应用
基于
Python
的客户分类和挖掘系统
宝音图 刘真真
(大连民族大学 信息与通信工程学院,辽宁 大连 116600)
摘 要:
在现在的市场当中,市场营销的重点与以前大不相同,以前的工作重心是产品,而现在工作重心转向客户,
所以准确地对客户进行价值定位,越来越重要,与此同时,数据分析和挖掘技术在市场营销中的使用也越来越广泛。笔
者开发一款基于
Python
的客户分类和挖掘系统,该系统采用
K-means
聚类方法和朴素贝叶斯分类。
关键词:
数据挖掘;聚类;朴素贝叶斯分类
中图分类
号:G206 文献标识码:A 文章编号:1003-9767(2018)15-072-03
The System of Customer Classification and Mining Based on Python
Bao Yintu, Liu Zhenzhen
(School of Information and Communication Engineering, Dalian Minzu University, Liaoning Dalian 116600, China)
Abstract:
In the current market, the focus of marketing is not the same as before. The focus of the previous work is the product,
and
now
the
focus
of
work
is
turning
to
the
customer,
so
it
is
becoming
more
and
more
important
to
locate
the
customer
value
accurately. At the same time, the use of data analysis and mining technology is becoming more and more popular in market marketing.
The author develops a customer classification and mining system based on Python. The system uses K-means clustering method and
Naive Bayesian classification.
Key words:
data mining; clustering; Naive Bayesian classification
客户关系管理成为了企业的核心问题,所以准确地对客
户进行价值定位,越来越重要,因此,对于不同的客户群体
制定与之相对应的营销策略和活动,是必须的,也是有效的。
本文以国内某航空公司的客户基本信息为数据对象,首先对数
据进行清洗,去除无效数据,拿出三个指标
RFM
,接下来对
RFM
三个指标进行规范化处理;其次通过
K-means
方法得到
客户聚类,完成客户分类,为重要价值客户提供高品质、针对
性的服务,
对普通价值客户,
采取措施,
稳定并提高客户价值;
最后通过朴素贝叶斯分类来实现对于客户分类预测的检验。
1 基于
RFM
的客户分类
1.1
数据预处理
1.1.1
数据清洗
本文所采用的数据是国内某个航空公司的客户基本情况
等详细数据,共有
62 989
个客户基本信息。为了实现基于
K-means
聚类分析的客户分析,采用模型为
RFM
,
R
为上次
乘坐本航空公司飞机的时间长度,
F
为乘坐本航空公司飞机
的频率,
M
为所花费的金额、行程
[1]
。数据处理需要删除零
票价的数据,只有非零票价,或平均折扣率不是零,同时,
飞行总公里数不为零的数据才是有效数据
[2]
。为了减少误差,
需要处理无效的客户数据,为了方便接下来的基于
K-means
聚类分析方法的使用,接下来从数据中提取出
3
个指标,分
别重新定义为
R
、
F
、
M
,并且保存数据,以便接下来对数据
进行规范化。得到清理后客户数据共有
62 045
个。
1.1.2
数据规范化处理
为了便于对顾客价值评分作出直观和全面的响应,需要
对其进行归一化,使用清洁后的三个指标。由于三个指标存
在不同的维度,采用
Z-score
可变标准法对各指标进行标准
化处理,避免了三个指标之间的差异数据对结果的造成影响,
以
R
为例。
基金项目:
大连民族大学
2015
年理工类自主科研基金培育专项(项目编号:DC201501063)支持。
作者简介:
宝音图(1995-),男,达斡尔族,内蒙古呼伦贝尔人,本科。研究方向:数据分析和挖掘。
通讯作者:
刘真真(1981-),女,山东泰安人,博士研究生,讲师。研究方向:社会网络分析、数据分析和挖掘。E-mail:
zhzhenliu@gmail.com。
— 72 —