使用MySQL进行数据分析

通过分析Kaggle的黑五销售数据,发现男性、26-35岁、未婚、居住1年的C城市用户为主要消费群体,尤其偏好产品类别1的1类产品。销售额主要集中在18-45岁年龄段,职业4,0,7,1,17的用户。建议针对男性用户、高消费职业群体进行个性化推荐,并优化1,5,8产品类别的库存分配。" 105077142,9328855,Spring Boot整合Mybatis与JSP热部署教程,"['Spring框架', 'Mybatis框架', 'Web开发', 'Maven构建', 'JSP模板']
摘要由CSDN通过智能技术生成

黑五电商数据分析

背景

为了合理的投入人力物力,创造更大的销售利润,现对已有的销售数据进行分析,提出合理的促销计划。本次的分析数据来自于Kaggle提供的某电商黑色星期五的销售记录,将围绕产品和用户两大方面展开叙述,为电商平台制定策略提供分析及建议。

使用工具:MySQL、Tableau、Excel

1. 提出问题:

  • 整体的消费情况
  • 用户分析
  • 产品分析
  • 细化分析

2. 数据理解:
部分数据预览:
在这里插入图片描述

原始数据中共有12个字段,每个字段共537578行,字段解释如下:
User_ID: 用户ID
Product_ID: 产品ID
Gender: 性别
Age: 年龄
Occupation: 职业
City_Category: 城市(A,B,C)
Stay_In_Current_City_Years: 居住时长
Marital_Status: 婚姻状况(1已婚,0未婚)
Product_Category_1 产品类别1
Product_Category_2 产品类别2
Product_Category_3 产品类别3
Purchase: 金额(美元)

3. 数据清洗:

  • 检测并删除重复数据:
SELECT
	*
FROM
	b_friday
GROUP BY
	User_ID,
	Product_ID
HAVING
	count(*) > 1;

查询结果为空,未发现重复项。

  • 缺失值处理:
    产品类别2和3字段有大量缺失,不能直接删除,使用0填充,方便后续操作。
UPDATE b_friday
SET Product_Category_2 = 0,
 Product_Category_3 = 0
WHERE
	Product_Category_2 IS NULL
OR Product_Category_3 IS NULL;

得到处理后的数据:
处理后的数据

4. 数据分析:

  • 整体消费情况:
SELECT 
	concat(sum(Purchase)/100000000,'亿美元') 总销售额,
	concat (round(sum(Purchase)/count(DISTINCT User_ID)/10000,4),'万美元') 人均消费,
	concat (sum(Purchase)/count(User_ID),'美元') 平均每单消费
from 
	b_friday;

在这里插入图片描述
从结果上看,可以大概知道本次的销售记录,记录的主要是大客户的消费数据,人均消费已经达到了85万美元!这些人一共贡献了50亿美金的销售额。

  • 用户分析:
    (1) 性别:
SELECT 
	Gender,
	count(DISTINCT User_id) 用户人数,
	concat(round(count(DISTINCT User_id)/(SELECT count(DISTINCT 	User_ID) FROM b_friday)*100,2),'%') 用户占比,
	concat(sum(Purchase)/100000000,'亿美元') 销售金额,
	concat(round(sum(Purchase)/count(DISTINCT User_ID)/10000,3),'万美元') 人均消费,
	concat(round(sum(Purchase)/(SELECT sum(Purchase) from b_friday),2)*
  • 2
    点赞
  • 73
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值