用户消费行为报告
学习秦路老师课程之后写的报告
本文将从五个步骤对该数据进行分析
一、数据清洗
缺失值的处理,数据类型的转化
二、进行用户消费趋势的分析(按月)
每月的消费总金额、每月的消费次数、每月的产品购买量、 每月的消费人数、每月用户平均消费金额的趋势、每月用户平均消费次数的趋势
三、用户个体消费分析
用户消费金额,消费次数的描述性统计、用户消费金额和消费次数的散点图、用户消费金额的分布图、用户消费次数的分布图、用户累计消费金额占比(百分之多少的用户占了百分之多少的消费额)
四、用户消费行为
用户第一次消费(首购)、用户最后一次消费、新老客消费比(多少用户仅消费了一次、每月新客占比)、 用户分层(RFM,新、活跃、回流、流失/不活跃)、用户购买周期(按订单)(用户消费周期描述、用户消费周期分布)、用户生命周期(按第一次&最后一次消费) (用户生命周期描述、 用户生命周期分布)
五、复购率和回购率分析
复购率(自然月内,购买多次的用户占比)、回购率(曾经购买过的用户在某一时期内的再次购买的占比)
一、数据清洗
加载包和数据,文件是txt,用read_table方法打开,因为原始数据不包含表头,所以需要赋予。字符串是空格分隔,用’\s+'表示任意空白符。
观察数据表,购买日期order_dt只是年月日组合的一串数字,没有时间含义,购买金额order_amount是小数。
注意:一个用户在一天内可能购买多次,ID为2的用户在1月12号买了两次。
用户平均每笔订单购买2.4个商品,标准差在2.3,稍稍具有波动性。中位数在2个商品,75分位数在3个商品,说明绝大部分订单的购买量都不多。最大值在99个,数字比较高。购买金额的情况差不多,大部分订单都集中在小额。
通过查看表的属性,可知该数据是很干净的数据。只需将时间的数据类型转换。
二、进行用户消费趋势的分析(按月)
- 每月的消费总金额
- 从图中可以看出,前几个月份的CD销售总金额比较大,紧接着数据下跌,后面月份的销量才趋于稳定。
- 每月的消费次数
- 前三个月消费订单数在10000笔左右,后续月份的平均消费人数则在2500人
- 每月的产品购买量
- 每月的产品购买量和和每月消费总金额一样,前几个月份购买量比较大,到后面月份购买量才趋于稳定。
- 每月的消费人数
- 每月消费人数低于每月消费次数,但差异不大
- 前三个月每月的消费人数在8000-10000之间,后续月份,平均消费人数在2000人不到
- 每月用户平均消费金额的趋势
- 从图中可以看出每月用户的平均消费金额忽高忽低,并不稳定,但总体呈上升趋势。
- 每月用户平均消费次数的趋势
- 从图中可知每月用户平均消费次也是忽高忽低,并无规律可言。
三、用户个体消费分析
- 用户消费金额和消费次数的描述性统计
- 每位用户平均购买7张CD,用户最多购买了1033张,属于狂热用户了。
- 用户的平均消费金额106元,标准差是240,结合分位数和最大值看,平均值才和75分位接近,肯定存在小部分的高额消费用户。
- 用户消费金额和消费次数的散点图
- 因为这是CD网站的销售数据,商品比较单一,金额和商品量的关系也因此呈线性,没几个离群点。
- 用户消费金额的分布图
- 从直方图可知,用户消费金额,绝大部分呈现集中趋势,小部分异常干扰了判断,可以使用过滤操作排除异常
-
用户消费次数的分布图
-
用户累计消费金额占比
四、用户消费行为
- 用户第一次消费(首购)
- 用户第一次购买分布,集中在前3个月,其中在2月11号至2月25号有一次剧烈的波动
- 用户最后一次消费
- 用户最后一次消费比第一次消费分布广
- 大部分最后一次消费集中在前三个月,说明很多客户购买一次就不再进行购买
- 随着时间的增长,最后一次购买数也在递增,消费呈现流失上升的情况,用户忠诚度在慢慢下降。
- 新老客消费比
多少用户仅消费了一次
- 有一半用户,就消费了一次
- 用户分层
RFM
- 从RFM分层可知,大部分用户为重要保持客户,但是这是由于极值的影响,所以RFM的划分标准应该为以业务为准
新、活跃、回流、流失/不活跃
- 接下来定义新函数:
- 若本月没有消费
- 若之前是未注册,则依旧为未注册
- 若之前有消费,则为流失/补活跃
- 其他情况,为未注册
- 若本月有消费
- 若是第一次消费,则为新用户
- 如果之前有过消费,则上个月为不活跃,则为回流
- 如果上个月为未注册,则为新用户
- 除此之外,为活跃
- 若本月没有消费
- 有上表可知,每月的用户消费状态变化
- 在1997年四月份以后,就不再有新客了
- 不活跃用户越来越多,活跃用户反而越来越少,回流用户也是相当的少
- 用户购买周期(按订单)
用户消费周期描述
用户消费周期分布
- 订单周期呈指数分布
- 用户的平均购买周期是68天
- 绝大部分用户的购买周期都低于100天
- 用户生命周期(按第一次&最后一次消费)
用户生命周期描述
用户生命周期分布
- 过滤掉仅消费了一次的用户,因为有不少用户生命周期靠拢在0天,部分质量差的用户虽然消费了两次,但是任然无法持续,在用户首次消费30天内应该尽量引导。少部分用户集中在50—300天,属于普通型的生命周期。高质量用户的生命周期,集中在400天以后,这属于忠诚用户。
五、复购率和回购率分析
- 复购率(自然月内,购买多次的用户占比)
- 复购率稳定在20%左右,前三个月因为有大量新用户涌入,而这批用户只购买了一次,所以导致复购率降低
- 回购率(曾经购买过的用户在某一时期内的再次购买的占比)
- 定义一个判断函数:当月消费过次月没有消费就定义为0,当月消费过次月也消费过就定义为1
- 从回购率和复购率综合分析可以得出,新客的整体质量低于老客,老客的忠诚度(回购率)表现较好,消费频次稍次,这是CDNow网站的用户消费特征。