本篇文章和网上最主要的区别是分别(使用BI)(使用MYSQL)(使用Python)(使用Excel)分别进行数据分析。
文章目录
- 一、BI(可视化展现(可PC端和移动端))
- 二、(MYSQL版本)数据字段说明、创建、导入数据库、多维度字段查询分析。
- 三、Python数据分析
-
- 1.看了描述统计,发现销售金额revenue有负数
- 2.由于销售收入和零收入存在较少,可以直接删除
- 3.查看数据是都有重复
- 4.查看是否有缺失值
- 5对城市和销售渠道进行分组,对顾客数求和并重置索引
- 6.不同城市的顾客通过线上或线下购买的人数对比(深红色:city;橙色:customer):
- 7.销售额随时间变化
- 8.销售收入占比
- 9.顾客随着时间的变化
- 10.客单价随着时间的变化
- 11.各时间段利润及单价的情况
- 12.我们在查看不同产品销售情况描述统计
- 13.不同产品的销售情况可视化
- 14.产品销量占比
- 15.产品利润占比
- 16.不同性别偏爱购买方式
- 17.不同城市偏爱购买方式
- 18.不同年龄阶段偏爱的购买方式
- 19.销售额与产品成本之间的关系
- 20.产品边际利润情况
- 21.查看产品成本与销售额的相关关系
- 四、Excel
- 总结和建议
一、BI(可视化展现(可PC端和移动端))
以下四张图是上下拼一起的,数据可以联动(在第一张小图那里筛选条件,有不同的组件)
这是导出Excel看板的图片:
二、(MYSQL版本)数据字段说明、创建、导入数据库、多维度字段查询分析。
数据字段:
store_id 门店随机编号id,无实际意义
city 门店所在城市
channel 门店所产生的销售渠道,线上表示网上购买到门店自提,线下表示门店直接购买
gender_group 客户性别 男女
age_group 客户年龄段
wkd_ind 购买发生的时间(周末,周中)
product 产品类别
customer 客户数量
revenue 销售金额
order1 订单数量
quant 购买的产品数量
unit_cost 产品的成本(包含制造和营销层面)
建好表后,看看数据类型:
DESCRIBE users;
-- 或者 DESC users;
-- 或者 SHOW COLUMNS FROM users;
导数据:
load data local infile 'C:/Users/xxxxxx/UNQ_DATA.csv' into table users fields terminated by ',';
因数据量,太大,先看看,前10行的数据:
select * from users limit 10;
1.描述性统计
客户数量:
SELECT MIN(DISTINCT customer) AS 客户数量最小值, MAX(DISTINCT customer) AS 客户数量最大值
, AVG(customer) AS 客户数量平均值
FROM users
WHERE customer > 0;
销售金额:
SELECT MIN(DISTINCT revenue) AS 销售金额最小值, MAX(DISTINCT revenue) AS 销售金额最大值
, AVG(revenue) AS 销售金额平均值
FROM users
WHERE revenue > 0;
购买的产品数量:
SELECT MIN(DISTINCT quant) AS 购买的产品数量最小值, MAX(DISTINCT quant) AS 购买的产品数量最大值
, AVG(quant) AS 购买的产品数量平均值
FROM users
WHERE quant > 0;
产品的成本:
SELECT MIN(DISTINCT unit_cost) AS 产品的成本最小值, MAX(DISTINCT unit_cost) AS 产品的成本最大值
, AVG(unit_cost) AS 产品的成本平均值
FROM users
WHERE unit_cost > 0;
订单数量:
SELECT MIN(DISTINCT order1) AS 订单数量最小值, MAX(DISTINCT order1) AS 订单数量最大值
, AVG(order1)