英国零售商分析

本文通过对2010-2011年英国零售商交易记录的分析,揭示了'二八定律'现象,即20%的大客户贡献了80%的销售额。数据清洗、KMeans聚类和RFM模型的应用帮助识别了大客户中的头部和尾端客户,以及各类客户的消费行为特征。其中,75%的大客户消费额低于平均值,且部分重要客户在近三个月未消费,提示需要关注客户流失及调整销售策略。
摘要由CSDN通过智能技术生成

1. 背景
2010到2011年的英国零售商的交易记录
2. 数据集描述
InvoiceNo:发票编号
StockCode:库存编号
Description:描述
Quantity:数量
InvoiceDate:(发票日期)交易时间
UnitPrice:单价
CustomerID:客户编号
Country:国家
3. 提出问题
a.了解现在英国零售商的现状
b.销售主要受到什么因素的影响
4. 分析思路
a.清洗数据(异常值、重复值、缺失值、数据类型转换、整合数据)
b.客户价值分析 (购买金额、购买频次、平均金额、购买内容、复购频次/间隔/内容),用户消费行为分析、RFM模型
5. 分析结论级运营建议
1)公司目前经营接近“二八定律”(约仅有20%的变因操纵着80%的局面)
2)数据显示,大客户类别里依旧存在75%的用户低于平均值,即低于7660英镑,由此可见存在优质客户拉高了整体水平
3)从时间维度看,重要价值和重要深耕客户在近三个月(即数据集中)并未产生消费行为,相反重要唤回和挽留客户比重在增加。这需要跟业务沟通原因,是销售政策倾斜导致目前现状,还是竞争对手吸引导致重要客户流失。如果皆不是需要重新修正RFM模型。
6. 数据清洗

6.1导入模块
6.11 数据处理

import numpy as np 
import pandas as pd

6.12可视化

import matplotlib.pyplot as plt
%matplotlib inline
import seaborn as sns
sns.set(style='darkgrid')
plt.rcParams['font.family']='SimHei'
plt.rcParams['axes.unicode_minus']=False
plt.rcParams['font.size']=15

6.13忽略警告

import warnings
warnings.filterwarnings('ignore')

6.14防止中文输出乱码

#!/usr/bin/env python
#coding:utf - 8

6.15聚类算法

from sklearn.cluster import KMeans

6.2读取数据

dt=pd.read_csv('E:/大数据/数据源/data/data.csv')
#预览数据
dt.head()
#查看数据大小
dt.shape
#给列名重命名
dt=dt.rename(columns={
   'InvoiceNo':'发票号','StockCode':'代码','Description':'产品名','Quantity':'数量',
                      'InvoiceDate':'发票日期','UnitPrice':'单价','CustomerID':'用户名','Country':'国家'})
#查看数据分布
dt.describe()

在这里插入图片描述

最小值这里数量和单价为负数,是异常值,要搞清楚
数量<=0,是退货数据,发票号开头是“C“的数据

dq=dt.loc[dt['发票号'].str[0]=='C']
dq.describe()

单价<=0

dt.loc[dt['单价']<=0,'单价'].groupby(dt['单价']).count()

可能为促销品,负数项太大可能是系统疏漏,删除处理

6.3数据清洗
6.31异常值处理

dt=dt[dt['数量']>0]
dt=dt[dt['单价']>0]
dt.shape

6.32缺失值处理


                
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值