基于天猫订单的数据分析

该项目利用SQL和Excel对2020年2月天猫28010条订单数据进行分析,涉及订单金额、支付、退款、地区等多个维度。发现周五销售额最高,晚上22点销量峰值,主要购买区间为20-200元,上海等地销售额领先。存在高退款率问题,建议优化产品质量和售后服务,针对西南、中部和东北地区开展促销。
摘要由CSDN通过智能技术生成


前言

该项目来自和鲸社区天猫订单数据分析
该项目本来使用的是Python语言,但因自身的SQL+Excel实战经验较少,使用SQL+Excel进行分析。
分享给大家,如有错误,烦请指出!

一、项目介绍

对2020年2月份的真实天猫订单成交数据(共28010条记录)进行数据分析,阐述销售现状、挖掘潜在规律、发现存在问题、提出可行性建议。

数据集介绍:
数据集来自和鲸,包含了天猫2020年2月份的共28010条订单数据,有以下7个字段:

  • 订单编号:共28010条
  • 总金额:该笔订单的总金额
  • 买家实际支付金额:实际成交金额。分为已付款和未付款两种情况:
    已付款:买家实际支付金额 = 总金额 - 退款金额
    未付款:买家实际支付金额 = 0
  • 收货地址:维度为省份,共包含31个省市
  • 订单创建时间:2020年2月1日 至 2020年2月29日
  • 订单付款时间:2020年2月1日 至 2020年3月1日
  • 退款金额:付款后申请退款的金额。没有申请退款或没有付过款,退款金额为0

二、实验环境

MySQL、VScode、Excel、Python

三、分析思路

分析目的:天猫2月份的订单情况,给出策略以提高销售额
思路:因为该数据只有订单的信息,首先使用多维度拆解分析方法把订单拆解为付款金额、付款时间、付款地区,并根据付款的业务流程,分析提交订单、付款以及退款的转化率。
1、根据付款金额区间将订单进行分组,查看每个区间的订单量分布。使用对比方法分析不同区间的数据指标。例如不同区间的销售额、销量、退款率。
2、根据付款金额将订单进行分组,查看月、周、日销售额、销量的变化趋势
3、根据付款地区将订单进行分组,查看每个地区的销售额和销量

四、数据预处理

优质的数据总是胜过优质的模型。

1. 将csv文件导入MySQL数据库中

参考:将CSV文件导入MySQL表

从和鲸社区下载order_report.csv 数据集,保存至mysql.ini文件规定的目录下
在这里插入图片描述
SQL语句创建表tmall

CREATE TABLE tmall(  
    order_id int NOT NULL PRIMARY KEY COMMENT 'Primary Key',
    total_amount float(9,1) NOT NULL COMMENT 'total amount',
    actual_amount float(9,1) NOT NULL COMMENT 'actual amount',
    address VARCHAR(255) NOT NULL COMMENT 'content',
    order_time DATETIME NOT NULL,
    pay_time DATETIME,
    refund_amount float(9,1)
) DEFAULT CHARSET UTF8 COMMENT 'newTable';

将数据从csv文件导入tmall表中

LOAD DATA INFILE 'C:/web/xxxx/uploads/order_report.csv' 
INTO 
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值