用户消费行为报告

用户消费行为报告

学习秦路老师课程之后写的报告

本文将从五个步骤对该数据进行分析
一、数据清洗
缺失值的处理,数据类型的转化
二、进行用户消费趋势的分析(按月)
每月的消费总金额、每月的消费次数、每月的产品购买量、 每月的消费人数、每月用户平均消费金额的趋势、每月用户平均消费次数的趋势
三、用户个体消费分析
用户消费金额,消费次数的描述性统计、用户消费金额和消费次数的散点图、用户消费金额的分布图、用户消费次数的分布图、用户累计消费金额占比(百分之多少的用户占了百分之多少的消费额)
四、用户消费行为
用户第一次消费(首购)、用户最后一次消费、新老客消费比(多少用户仅消费了一次、每月新客占比)、 用户分层(RFM,新、活跃、回流、流失/不活跃)、用户购买周期(按订单)(用户消费周期描述、用户消费周期分布)、用户生命周期(按第一次&最后一次消费) (用户生命周期描述、 用户生命周期分布)
五、复购率和回购率分析
复购率(自然月内,购买多次的用户占比)、回购率(曾经购买过的用户在某一时期内的再次购买的占比)

一、数据清洗

加载包和数据,文件是txt,用read_table方法打开,因为原始数据不包含表头,所以需要赋予。字符串是空格分隔,用’\s+'表示任意空白符。
图1.1
图1.2
观察数据表,购买日期order_dt只是年月日组合的一串数字,没有时间含义,购买金额order_amount是小数。
注意:一个用户在一天内可能购买多次,ID为2的用户在1月12号买了两次。
在这里插入图片描述
用户平均每笔订单购买2.4个商品,标准差在2.3,稍稍具有波动性。中位数在2个商品,75分位数在3个商品,说明绝大部分订单的购买量都不多。最大值在99个,数字比较高。购买金额的情况差不多,大部分订单都集中在小额。
在这里插入图片描述
通过查看表的属性,可知该数据是很干净的数据。只需将时间的数据类型转换。
在这里插入图片描述

二、进行用户消费趋势的分析(按月)

  1. 每月的消费总金额
    在这里插入图片描述
    在这里插入图片描述
  • 从图中可以看出,前几个月份的CD销售总金额比较大,紧接着数据下跌,后面月份的销量才趋于稳定。
  1. 每月的消费次数
    在这里插入图片描述
  • 前三个月消费订单数在10000笔左右,后续月份的平均消费人数则在2500人
  1. 每月的产品购买量
    在这里插入图片描述
  • 每月的产品购买量和和每月消费总金额一样,前几个月份购买量比较大,到后面月份购买量才趋于稳定。
  1. 每月的消费人数
    在这里插入图片描述
  • 每月消费人数低于每月消费次数,但差异不大
  • 前三个月每月的消费人数在8000-10000之间,后续月份,平均消费人数在2000人不到
  1. 每月用户平均消费金额的趋势
    在这里插入图片描述
  • 从图中可以看出每月用户的平均消费金额忽高忽低,并不稳定,但总体呈上升趋势。
  1. 每月用户平均消费次数的趋势
    在这里插入图片描述
  • 从图中可知每月用户平均消费次也是忽高忽低,并无规律可言。

三、用户个体消费分析

  1. 用户消费金额和消费次数的描述性统计
    在这里插入图片描述
  • 每位用户平均购买7张CD,用户最多购买了1033张,属于狂热用户了。
  • 用户的平均消费金额106元,标准差是240,结合分位数和最大值看,平均值才和75分位接近,肯定存在小部分的高额消费用户。
  1. 用户消费金额和消费次数的散点图
    在这里插入图片描述
  • 因为这是CD网站的销售数据,商品比较单一,金额和商品量的关系也因此呈线性,没几个离群点。
  1. 用户消费金额的分布图
    在这里插入图片描述
  • 从直方图可知,用户消费金额,绝大部分呈现集中趋势,小部分异常干扰了判断,可以使用过滤操作排除异常
  1. 用户消费次数的分布图
    在这里插入图片描述

  2. 用户累计消费金额占比
    在这里插入图片描述

四、用户消费行为

  1. 用户第一次消费(首购)
    在这里插入图片描述
  • 用户第一次购买分布,集中在前3个月,其中在2月11号至2月25号有一次剧烈的波动
  1. 用户最后一次消费
    在这里插入图片描述
  • 用户最后一次消费比第一次消费分布广
  • 大部分最后一次消费集中在前三个月,说明很多客户购买一次就不再进行购买
  • 随着时间的增长,最后一次购买数也在递增,消费呈现流失上升的情况,用户忠诚度在慢慢下降。
  1. 新老客消费比

多少用户仅消费了一次
在这里插入图片描述

  • 有一半用户,就消费了一次
  1. 用户分层

RFM
在这里插入图片描述
在这里插入图片描述

  • 从RFM分层可知,大部分用户为重要保持客户,但是这是由于极值的影响,所以RFM的划分标准应该为以业务为准

新、活跃、回流、流失/不活跃
在这里插入图片描述

  • 接下来定义新函数:
    • 若本月没有消费
      • 若之前是未注册,则依旧为未注册
      • 若之前有消费,则为流失/补活跃
      • 其他情况,为未注册
    • 若本月有消费
      • 若是第一次消费,则为新用户
      • 如果之前有过消费,则上个月为不活跃,则为回流
      • 如果上个月为未注册,则为新用户
      • 除此之外,为活跃

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 有上表可知,每月的用户消费状态变化
  • 在1997年四月份以后,就不再有新客了
  • 不活跃用户越来越多,活跃用户反而越来越少,回流用户也是相当的少
  1. 用户购买周期(按订单)

用户消费周期描述
在这里插入图片描述

用户消费周期分布
在这里插入图片描述

  • 订单周期呈指数分布
  • 用户的平均购买周期是68天
  • 绝大部分用户的购买周期都低于100天
  1. 用户生命周期(按第一次&最后一次消费)

用户生命周期描述
在这里插入图片描述

用户生命周期分布
在这里插入图片描述

  • 过滤掉仅消费了一次的用户,因为有不少用户生命周期靠拢在0天,部分质量差的用户虽然消费了两次,但是任然无法持续,在用户首次消费30天内应该尽量引导。少部分用户集中在50—300天,属于普通型的生命周期。高质量用户的生命周期,集中在400天以后,这属于忠诚用户。

五、复购率和回购率分析

  1. 复购率(自然月内,购买多次的用户占比)
    在这里插入图片描述
    在这里插入图片描述
  • 复购率稳定在20%左右,前三个月因为有大量新用户涌入,而这批用户只购买了一次,所以导致复购率降低
  1. 回购率(曾经购买过的用户在某一时期内的再次购买的占比)

在这里插入图片描述

  • 定义一个判断函数:当月消费过次月没有消费就定义为0,当月消费过次月也消费过就定义为1
    在这里插入图片描述

在这里插入图片描述

  • 从回购率和复购率综合分析可以得出,新客的整体质量低于老客,老客的忠诚度(回购率)表现较好,消费频次稍次,这是CDNow网站的用户消费特征。

秦路老师的课

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值