文章导览
目标定义
数据获取
数据探索性分析
数据清洗
RFM模型处理
一、目标定义
这里有一个关于欧洲某商家2010年12月-2011年12月的销售数据截取的部分片段。目标是根据RF模型对顾客进行划分。
二、数据获取
RFM模型训练用 - Heywhale.comhttps://www.heywhale.com/mw/dataset/623f3a0b40f3c80018378be0/file数据集已挂在和鲸社区,链接如上
三、探索性分析
3,1 分析方向
查看数据类型、字段、大小、缺失情况,异常情况等
## 导入相关依赖
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
plt.rcParams["font.sans-serif"]=["SimHei"]
plt.rcParams['axes.unicode_minus'] = False # 解决中文显示的问题
from warnings import filterwarnings
filterwarnings('ignore') # 忽略警告的问题
import seaborn as sns
!pip install brewer2mpl # 解决画图库尴尬的配色问题
import brewer2mpl
# 导入数据
data = pd.read_csv("./data_sale.csv")
data.head(10)
# 查看基本信息
data.shape
data.isnull().sum()
data.info()
# 输出如下
(541909, 8)
InvoiceNo 0
StockCode