olist巴西电商数据分析项目 sql+tableau

本文基于巴西Olist电商平台2016-2018年的数据,通过SQL清洗和Tableau可视化分析了整体情况、用户、商户、产品和销售五个方面。发现DAU和MAU逐渐增长,尤其在"黑色星期五"期间表现突出。用户主要集中在SP州,75.7%的支付采用信用卡,且用户倾向于选择2-3期的分期付款。商户主要分布在SP州,交易额以小商户为主。商品交易额和交易量趋势相似,显示平台商品价格相近,主要集中在100-200元。建议平台关注用户流失、提高转化率、发展海外市场和多样化商品类别。
摘要由CSDN通过智能技术生成

一、分析背景

巴西Olist是当地电商平台,本数据集包含2016年9月-2018年8月的数据,本文将通过对平台的整体情况、用户、商家、产品、销售五个方面分析平台的经营状况,目的是为了发现平台可能存在的问题,分析可能的原因并给出建议。

数据链接:https://www.kaggle.com/jainaashish/orders-merged

数据字段说明:

1、product_id:商品ID
2、seller_id:商家ID
3、order_id:订单ID
4、customer_id:订单对应的用户ID。订单数据集的键,每个订单都有一个唯一的customer_id。
5、order_status:订单状态
6、order_purchase_timestamp:下单时间
7、order_approved_at:付款审批时间
8、order_delivered_carrier_date:订单过账日期
9、order_delivered_customer_date:客户实际订单交货日期
10、order_estimated_delivery_date:订单预计交货日期
11、customer_unique_id:用户ID
12、customer_zip_code_prefix:客户邮政编码前5位
13、customer_city:客户所在城市
14、customer_state:客户所在的州
15、review_id:评论ID
16、review_score:评价得分,客户在满意度调查中给出的注释范围为1到5。
17、review_comment_title:评论标题
18、review_comment_message:评论内容
19、review_creation_date:发出满意度调查日期
20、review_answer_timestamp:客户满意度回复日期
21、payment_sequential:付款顺序,客户可以使用多种付款方式付款。
22、payment_type:付款方式
23、payment_installments:客户选择的分期付款数量
24、payment_value:交易金额
25、order_item_id:序号,用于标识同一订单中包含的商品数量。
26、price:商品价格
27、freight_value:运费,物品运费价值物品(如果订单包含多个物品,则运费价值将在物品之间分配)
28、seller_zip_code_prefix:卖家邮政编码前5位
29、seller_city:卖家所在城市
30、seller_state:卖家所在州
31、product_category_name:类别名称
32、product_name_lenght:产品名称长度
33、product_description_lenght:产品说明长度
34、product_photos_qty:产品照片数量
35、product_weight_g:产品重量单位g
36、product_length_cm:产品长度单位cm
37、product_height_cm:产品高度单位cm
38、product_width_cm:产品宽度单位cm


二、分析框架

 

通过整体情况、用户、商家、产品、销售五个方面分析,使用工具为sql和可视化工具tableau。

三、分析及可视化

1、数据清洗

#查看数据有多少
SELECT COUNT(*) FROM orders_merged
#去除重复的数据行
SELECT DISTINCT * FROM orders_merged
#建立视图将日期转化为年、月、日、小时的格式,方便后续分析使用
CREATE VIEW order_time AS
SELECT order_id, 
 customer_unique_id,
 year(order_purchase_timestamp) AS y,
 month(order_purchase_timestamp) AS m,
 date(order_purchase_timestamp) AS d,
 hour(order_purchase_timestamp) AS h 
FROM orders_merged

2、整体情况分析

#总交易金额
SELECT SUM(payment_value) AS 总交易金额 FROM orders_merged
#总订单量
SELECT count(order_id) AS 总订单量 FROM orders_merged
#客单价
SELECT sum(payment_value)/count(DISTINCT customer_unique_id) AS 客单价 FROM orders_merged
#用户数
SELECT count(DISTINCT customer_unique_id) AS 用户数 FROM orders_merged
#商家数
SELECT count(DISTINCT seller_id) AS 商家数 FROM orders_merged
#SPU
SELECT count(DISTINCT product_category_name) AS SPU FROM orders_merged 
#SKU
SELECT count(DISTINCT product_id) AS SKU FROM orders_merged

  运行代码分别得到结果为总交易金额11,079,647.08元,总订单数70,478笔,客单价161元,

  • 1
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值