RFM模型:主要作用是多企业客户做消费群体分类,根据美国数据库营销研究所Arthur Hughes的研究,客户数据库中有三个最为重要的要素,这三个要素构成数据分析的最好得指标:
1.最近一次西消费(Recency)
2.消费频率(Frequency)
3.消费金额(Money)
理论上,上一次消费时间越近的客户应该是比较好的顾客,对提供即时的商品或者是服务也最有可能会有反应,营销人员如果想提高自己的业绩,只能靠获取对手的市场占有率来做营销,而如果要密切关注消费者的购买行为,则消费者最近一次消费是营销人员最好利用的一个工具了,体现在最近购买的顾客收到各种推送和营销信息的频率会远比一年半载才购买一次的顾客收到的营销信息频率高出很多。最近一次消费报告可以监督事业的健全度,定期查看消费者最近消费情况,包括时间、消费金额、频率等,可以提高营销人员的业绩。消费频率则是顾客在限定时间内购买的次数,消费金额这是所有数据库报告的支柱,也可以验证“帕累托法则”。
一、下面将通过基于Python和MySQL讲解客户消费分群
案列数据链接:https://pan.baidu.com/s/12CUAPTRHSB_tzEXv0l22fg
提取码:kscq
复制这段内容后打开百度网盘手机App,操作更方便哦
复制这段内容后打开百度网盘手机App,操作更方便哦
- 首先将需要处理数据的模块导入Python,此处用到numpy,pandas,以及机器学习主库下的KMeans聚类模块
import numpy as np #numpy模块用于数据运算处理
import pandas as pd #pandas用于数据处理
import pymysql #连接数据库导出数据
from sklearn.cluster import KMeans #引用KMeans聚类算法
2. 建立Python与MySQL的连接,从中提取数据(注:上面网盘里的数据时MySQL中一张表)
conn=pymysql.connect(host='localhost',user='root',passwd='123456',db='pymsql',charset='utf8') #创建连接
#创建游标
cursor=conn.cursor()
#创建查询语句
sql='select * from consumption_data'
#执行语句
cursor.execute