文章目录
前言
该项目来自和鲸社区天猫订单数据分析
该项目本来使用的是Python语言,但因自身的SQL+Excel实战经验较少,使用SQL+Excel进行分析。
分享给大家,如有错误,烦请指出!
一、项目介绍
对2020年2月份的真实天猫订单成交数据(共28010条记录)进行数据分析,阐述销售现状、挖掘潜在规律、发现存在问题、提出可行性建议。
数据集介绍:
数据集来自和鲸,包含了天猫2020年2月份的共28010条订单数据,有以下7个字段:
- 订单编号:共28010条
- 总金额:该笔订单的总金额
- 买家实际支付金额:实际成交金额。分为已付款和未付款两种情况:
已付款:买家实际支付金额 = 总金额 - 退款金额
未付款:买家实际支付金额 = 0 - 收货地址:维度为省份,共包含31个省市
- 订单创建时间:2020年2月1日 至 2020年2月29日
- 订单付款时间:2020年2月1日 至 2020年3月1日
- 退款金额:付款后申请退款的金额。没有申请退款或没有付过款,退款金额为0
二、实验环境
MySQL、VScode、Excel、Python
三、分析思路
分析目的:天猫2月份的订单情况,给出策略以提高销售额
思路:因为该数据只有订单的信息,首先使用多维度拆解分析方法把订单拆解为付款金额、付款时间、付款地区,并根据付款的业务流程,分析提交订单、付款以及退款的转化率。
1、根据付款金额区间将订单进行分组,查看每个区间的订单量分布。使用对比方法分析不同区间的数据指标。例如不同区间的销售额、销量、退款率。
2、根据付款金额将订单进行分组,查看月、周、日销售额、销量的变化趋势
3、根据付款地区将订单进行分组,查看每个地区的销售额和销量
四、数据预处理
优质的数据总是胜过优质的模型。
1. 将csv文件导入MySQL数据库中
从和鲸社区下载order_report.csv 数据集,保存至mysql.ini文件规定的目录下
SQL语句创建表tmall
CREATE TABLE tmall(
order_id int NOT NULL PRIMARY KEY COMMENT 'Primary Key',
total_amount float(9,1) NOT NULL COMMENT 'total amount',
actual_amount float(9,1) NOT NULL COMMENT 'actual amount',
address VARCHAR(255) NOT NULL COMMENT 'content',
order_time DATETIME NOT NULL,
pay_time DATETIME,
refund_amount float(9,1)
) DEFAULT CHARSET UTF8 COMMENT 'newTable';
将数据从csv文件导入tmall表中
LOAD DATA INFILE 'C:/web/xxxx/uploads/order_report.csv'
INTO