python 客户信息管理系统_基于Python的客户分类和挖掘系统

2018

年第

15

信息与电脑

China Computer&Communication

软件开发与应用

基于

Python

的客户分类和挖掘系统

宝音图 刘真真

(大连民族大学 信息与通信工程学院,辽宁 大连 116600)

摘 要:

在现在的市场当中,市场营销的重点与以前大不相同,以前的工作重心是产品,而现在工作重心转向客户,

所以准确地对客户进行价值定位,越来越重要,与此同时,数据分析和挖掘技术在市场营销中的使用也越来越广泛。笔

者开发一款基于

Python

的客户分类和挖掘系统,该系统采用

K-means

聚类方法和朴素贝叶斯分类。

关键词:

数据挖掘;聚类;朴素贝叶斯分类

中图分类

号:G206  文献标识码:A  文章编号:1003-9767(2018)15-072-03

The System of Customer Classification and Mining Based on Python

Bao Yintu, Liu Zhenzhen

(School of Information and Communication Engineering, Dalian Minzu University, Liaoning Dalian 116600, China)

Abstract:

In the current market, the focus of marketing is not the same as before. The focus of the previous work is the product,

and

now

the

focus

of

work

is

turning

to

the

customer,

so

it

is

becoming

more

and

more

important

to

locate

the

customer

value

accurately. At the same time, the use of data analysis and mining technology is becoming more and more popular in market marketing.

The author develops a customer classification and mining system based on Python. The system uses K-means clustering method and

Naive Bayesian classification.

Key words:

data mining; clustering; Naive Bayesian classification

客户关系管理成为了企业的核心问题,所以准确地对客

户进行价值定位,越来越重要,因此,对于不同的客户群体

制定与之相对应的营销策略和活动,是必须的,也是有效的。

本文以国内某航空公司的客户基本信息为数据对象,首先对数

据进行清洗,去除无效数据,拿出三个指标

RFM

,接下来对

RFM

三个指标进行规范化处理;其次通过

K-means

方法得到

客户聚类,完成客户分类,为重要价值客户提供高品质、针对

性的服务,

对普通价值客户,

采取措施,

稳定并提高客户价值;

最后通过朴素贝叶斯分类来实现对于客户分类预测的检验。

1 基于

RFM

的客户分类

1.1

数据预处理

1.1.1

数据清洗

本文所采用的数据是国内某个航空公司的客户基本情况

等详细数据,共有

62 989

个客户基本信息。为了实现基于

K-means

聚类分析的客户分析,采用模型为

RFM

R

为上次

乘坐本航空公司飞机的时间长度,

F

为乘坐本航空公司飞机

的频率,

M

为所花费的金额、行程

[1]

。数据处理需要删除零

票价的数据,只有非零票价,或平均折扣率不是零,同时,

飞行总公里数不为零的数据才是有效数据

[2]

。为了减少误差,

需要处理无效的客户数据,为了方便接下来的基于

K-means

聚类分析方法的使用,接下来从数据中提取出

3

个指标,分

别重新定义为

R

F

M

,并且保存数据,以便接下来对数据

进行规范化。得到清理后客户数据共有

62 045

个。

1.1.2

数据规范化处理

为了便于对顾客价值评分作出直观和全面的响应,需要

对其进行归一化,使用清洁后的三个指标。由于三个指标存

在不同的维度,采用

Z-score

可变标准法对各指标进行标准

化处理,避免了三个指标之间的差异数据对结果的造成影响,

R

为例。

基金项目:

大连民族大学

2015

年理工类自主科研基金培育专项(项目编号:DC201501063)支持。

作者简介:

宝音图(1995-),男,达斡尔族,内蒙古呼伦贝尔人,本科。研究方向:数据分析和挖掘。

通讯作者:

刘真真(1981-),女,山东泰安人,博士研究生,讲师。研究方向:社会网络分析、数据分析和挖掘。E-mail:

zhzhenliu@gmail.com。

—   72   —

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值