Olist巴西电商数据分析(一)

本文分析了巴西电商Olist的数据,涵盖用户、商家、商品和销售四个维度。发现用户主要使用信用卡支付,74%不选择分期;用户下单集中在10点到22点;SP地区用户最多。商家主要分布在SP,多数交易量和销售额较低,送货时间平均为10天左右。评分与送货时间和地区相关。
摘要由CSDN通过智能技术生成

Olist巴西电商数据分析

下篇指路:https://blog.csdn.net/jlycd/article/details/114001930



项目背景

本项目是来自kaggle上的数据集案例,记录了巴西电商平台Olist 2016,2018的真实业务数据数据,包含以下的内容。
在这里插入图片描述

分析目标

1.通过用户,商家,产品,销售四个维度分析该平台的总体经营状况和所处阶段
2.发现平台存在的问题,分析原因,给出相应的建议
3.对于异常指标的变化,分析原因
4.对未来的工作给出总体方向,目标和合理化建议


搭建数据分析架构

在这里插入图片描述

主要通过用户,商家,产品,销售四个维度来展开分析各项指标。
使用到的工具主要有python,excel,tableau等

数据分析

用户维度

主要分析的方向有用户的地区分布,用户支付方式,分期偏好,下单时间等行为偏好,以及基于RFM模型将用户进行分层
数据导入处理

import numpy as np
import pandas as pd
payments=pd.read_csv('olist_order_payments_dataset.csv')
customers=pd.read_csv('olist_customers_dataset.csv')
orders=pd.read_csv('olist_orders_dataset.csv')
orders.isnull().sum()
payments.isnull().sum()
customers.isnull().sum() #缺失值查看

由于缺失值仅在order_approved_at,order_delivered_carrier_date,order_delivered_customer_date这三个列出现,而这三列与我们分析工作关系不大,所以可以忽略。

po=pd.merge(payments,orders,how='left',on='order_id')
pc=pd.merge(po,customers,how='left',on='customer_id')#数据合并
state=pd.DataFrame(pc['customer_unique_id'].groupby([pc['customer_state']]).count())
#用户地区分布

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
该平台的用户大多数来自于SP比例高达42%,其次是RJ和MG。这可能与巴西人口密度分布有关,当然也与平台在其他地区程度的普及程度,当地人购物方式有着很大的关系。

p_type_c=pd.DataFrame(pc['customer_unique_id'].groupby([pc['payment_type'],pc['customer_state']]).count())#用户支付方式和所在州统计
p_type=pd.DataFrame(pc['customer_unique_id'].groupby(pc['payment_type']).count
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值