用SQL和tableau做数据分析实战--O2O优惠券线下使用数据分析阿里天池数据集

本文通过阿里天池数据集,详细阐述了使用SQL进行数据清洗、分析以及使用Tableau进行数据可视化的过程。分析涵盖用户、商户、优惠券等多方面,发现优惠券核销率低、用户留存与消费行为、商户核销率等特点,并探讨了影响因素。
摘要由CSDN通过智能技术生成

本文以‘o2o优惠券线下核销数据集’的分析全过程为例,展示数据分析的全过程

数据清洗工具:jupyter notebook

数据分析工具:datagrip,Excel

可视化图表工具:tableau

分析类型:描述性分析,诊断分析

分析方法:漏斗分析,RFM用户价值分析,AARRR分析,假设检验分析。

目录

一.数据清洗

1.1数据集来源

1.2数据说明

1.3数据导入

1.4查看缺失值

1.5 数据处理​编辑

1.6 保存文件​编辑

二.将文件导入datagrip中用SQL分析

2.1查询各列数据为空值的数量 

三.总体情况统计分析

3.1 数据总体情况 

3.2 优惠券每月核销情况统计

3.3 每月新增用户数

四.用户分析

4.1 获客:每日新增用户情况

4.2 转化及流失情况

4.3 用户行为转化漏斗计算

 4.4 用户留存情况

4.5 用户价值分析

4.5.1 先查询用户最近的消费时间间隔及消费频次

4.5.2  分别查询R,F的最大值,最小值以及各值数量分布情况

 4.5.3 根据R,F值最大值和最小值的区间设计本次的打分标准,计算R,F的值

 4.5.4 查询R,F值的平均值

 4.5.5 根据平均值和用户分类规则表对用户分类

4.5.6 查询各分层用户数量

五.商户分析

5.1 每月有消费商户统计

5.2 一周内每天有消费的商户数量

5.3 商户整体核销率,核销率在0.25以下的商户占比

5.6 商户分层

六.优惠券分析

 6.1 优惠券每日领取,每日核销情况

6.2 优惠券平均核销时间

6.3 不同距离下优惠券的领取量及核销率

七. 相关分析

7.1 门店距离与优惠券核销率的相关性

7.2 优惠券折扣与核销率的相关性

 八.Tableau可视化图表

九.数据分析


一.数据清洗

1.1数据集来源

阿里天池:O2O优惠券使用预测数据集_Tianchi Datasets (aliyun.com)

1.2数据说明

该数据集提供2016年1月1日至2016年6月30日的真实线上和线下用户消费数据。研究人员预计将预测客户在收到优惠券后 15 天内兑换优惠券的概率。

线下消费及优惠券表(offline_train.csv.zip)

1.3数据导入

1.4查看缺失值

#通过查看缺失值发现Coupon_id,Discount_rate及Date_received的缺失值数量一样,Coupon_id表示优惠券id,当它为null时,说明没有这张优惠券,那么Discount_rate,Date_received也没有意义,所以存在三者同时为null的情况是合理的。
#用0替代Coupon_id,Discount_rate的缺失值,用fillna()对缺失值进行填充
#Distance出现缺失值可能是用户关闭了定位地理位置授权,由于Distance的取值为【0-10】,所以可选12作为缺失值填充

1.5 数据处理

1.6 保存文件

二.将文件导入datagrip中用SQL分析

2.1查询各列数据为空值的数量 

输出:

三.总体情况统计分析

3.1 数据总体情况 

输出:

分析:领券总人数1053282人,但领券消费人数仅有75382人,核销率7.16%,优惠券使用率低。

3.2 优惠券每月核销情况统计

输出:


3.3 每月新增用户数

 输出:

分析:月新增用户呈波段式增加,1,3,5月份新增用户增加明显,考虑是当月优惠券的发放优化、商户促销活动、渠道推广等因素影响

四.用户分析

4.1 获客:每日新增用户情况

输出:

4.2 转化及流失情况

 2016-01-01至2016~06-30指标情况:

 输出:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值