消费品销售数据分析(SQL)

本文通过对消费品销售数据的深入分析,揭示了用户消费、购买模式、RFM模型指标及商品销售趋势。用户消费呈现月度和季度波动,新用户数量下降,复购率稳定在62%左右。重要价值客户和一般客户是主要消费群体。商品销售中,UNJKW和N8U等商品表现出明显的季节性变化,8月低谷,12月高峰。
摘要由CSDN通过智能技术生成

分析背景

本文分析了有关消费品销售的详细数据,这些数据通过零售店的电子销售点“扫描”单个产品的条形码所获得,提供了有关所售货物的数量、特征和价值及其价格的详细信息。

分析目的

提出问题:

  • 用户消费情况分析
  • 用户购买模式分析
  • RFM和CLV分析
  • 商品销售分析

思维导图

数据集概览

3.1 数据集描述
数据来源: https://www.kaggle.com/marian447/retail-store-sales-transactions
数据集名称: Retail Store Sales Transactions (Scanner Data)
数据集大小: 131706*8
3.2 数据字段理解
表:scanner_data

字段名 字段意义
ID 销售ID
Date 销售日期
Customer_ID 客户ID
Transaction_ID 交易ID
SKU_Category 商品分类SKU编码
SKU 商品唯一SKU编码
Quantity 售出数量
Sales_Amount 销售额

Sales_Amount为单价乘以数量

数据清洗

1.重复值
重复值判断

原有数据和去重后数据条数相等,无重复值。

2.缺失值
缺失值判断

由图中可以看出,所有字段的数据数量相同,故没有缺失值。

3.异常值
观察数据集字段,可能出现异常值的字段有Quantity和Sales_Amount。

1.查看字段Quantity是否存在异常值

Quantity异常值

Quantity小于1可能是因为称重单位,非异常值。

2.查看字段Sales_Amount是否存在异常值

Sales_Amount异常值

Sales_Amount无异常值。

数据清洗所用到的部分SQL:

#重复值判断
CREATE TABLE scanner LIKE scanner_data;
INSERT INTO scanner
SELECT DISTINCT * FROM scanner_data;

#缺失值判断
SELECT
COUNT(ID),
COUNT(Date),
COUNT(Customer_ID),
COUNT(Transaction_ID),
COUNT(SKU_Category),
COUNT(SKU),
COUNT(Quantity),
COUNT(Sales_Amount)
FROM scanner;

#异常值判断
SELECT MAX(Quantity), MIN(Quantity)
FROM scanner;
SELECT MAX(Sales_Amount), MIN(Sales_Amount)
FROM scanner;

数据分析

用户消费分析

月追踪

月追踪

月均消费额

由图可见,月消费数量、月消费人数、月消费次数和月销售总额的总体趋势相似。波动较大,前5月呈上升趋势,随后开始下降,8月降至最低值,此后波动回升。
月均消费额波动较大,前4月呈上升趋势,5月下降后于7月达到最高值,随后持续下滑,10月后缓慢回升。

季追踪

季追踪

季均消费额

由图可见,除季均消费额外,其余四图的总体趋势相似,前两季度呈上升趋势,第三季度下降,第四季度回升。
结合月追踪和季追踪,总体消费情况在春末夏初达到第一个高点,并于盛夏回落至低点,随后波动回升。
鉴于此数据集未包含商品的具体描述,无法探究时令与购买商品之间的关联。八月即三季度回落至低点,可能与国外暑期休假有关,但无法给出验证。

用户购买分析

新用户分布

新用户数量天

新用户数量月

由图可见,新用户数量总体呈波动下降趋势,新用户获取可能不稳定。

消费次数分布

消费次数

仅消费一次的用户数量为6301,占比27.85%,可见多数用户进行了复购。

下面对复购率和回购率进行分析。

复购率

当月复购率
由图可知,复购率在62%上下浮动,说明每月有62%的用户进行了多次购物。

回购率

次月回购率
由图可知,回购率在59%上下浮动,30天内的回购率在45%-65%之间。

RFM模型指标

客户类别
rfm

由图可知,目前主要消费额来自于重要价值客户和一般客户,而大多数用户属于一般客户。
重要客户人数不多,但客单价高:

  • 重要价值客户:近期有消费,消费频率高,消费高,应保证该层客户维持现状;
  • 重要发展客户:近期有消费,消费频率低,消费高,应适当推广营销活动,提升消费频率;
  • 重要保持客户:近期无消费,消费频率高,消费高,应鼓励召回用户;
  • 重要挽留用户:近期无消费,消费频率低,消费高,可能处于流失边缘,应推广营销活动,鼓励消费;

一般客户人数众多,但客单价低:

  • 一般价值客户:近期有消费,消费频率高,消费低,应推广营销活动,提升消费额;
  • 一般发展客户:近期有消费,消费频率低,消费低;
  • 一般保持客户与一般挽留客户:两者贡献消费额可抵重要价值客户,主要在于客单价低且客户数庞大,应在控制成本和资源的情况下,适当采用推广营销活动,转化用户。

用户生命周期分布

用户分类
L

由图表可知,近期未消费且首尾消费间隔小于半年的一次性用户人数最多,流失率较高,可推广营销活动,促进消费;
近期有消费,首尾消费间隔大于半年的忠诚用户人数紧随其后,可保持现状;
近期有消费,首尾消费间隔小于半年的新用户人数不多,需要增加新用户获取。

商品销售分析

热销商品排名

商品销售数量
商品购买人数

由图可知,在商品销售数量和购买人数都排名前十的有UNJKW、W1ZMG和C6TXL,其中UNJKW均排名前三。
对UNJKM进行分析:
UNJKW
商品UNJKW的销量和购买人数趋势相同,前三季度总体呈下降趋势,于8月达最低点,随后波动上升,并于12月达到最高点。无法判断是否具有季节性,但可判断8月休假期导致销售情况不利,年末跨年假期导致销售情况暴涨。

热销商品品类排名

商品品类销售数量
商品品类购买人数
由图可知,在商品品类销售数量和购买人数都排名前十的有N8U、LPF、IEV、U5F、R6E和P42,其中N8U均排名前三。
对N8U进行分析:

  • 3
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值