目录
一、目的
从超市会员消费记录中找出规律,并判断会员次月光顾超市的次数。
二、数据来源和相关说明
1、数据来源
来源于某家超市部分会员的详细消费记录。
import os
import numpy as np
import pandas as pd
from matplotlib import pyplot as plt
# 参数设置
plt.rcParams['font.sans-serif']=['SimHei'] #中文
plt.rcParams['axes.unicode_minus'] = False #负号
filePath = r'E:\CH6'
fileName = r'crm.csv'
# 读取数据
df_raw = pd.read_csv(open(os.path.join(filePath, fileName)))
2、数据信息
共3995条样本,包含7个变量。
print(df_raw.info())
print(df_raw.head())
3、变量信息
# 变量列表
str_cols = []
num_cols = ['exp3', 'exp2', 'exp1', 'freq3', 'freq2', 'freq1' ]
x_cols = str_cols + num_cols
y_col = 'freq0'
(1)自变量
- freq1、freq2、freq3分别为会员第-1月、第-2月、第-3月光顾超市的频数。
- exp1、exp2、exp3分别为会员第-1月、第-2月、第-3月的消费金额。
(2)因变量
- freq0为会员第0月光顾超市的频数。
三、描述性分析
df_clean = df_raw.copy()
1、描述统计
从下述指标看,按平均水平来说(以算术平均计),每个月每位会员光顾该超市大约1次,消费金额为5-20元。
# 基本统计量
print(df_clean.describe().T)