2019年用户流失分析(一)——Python实现

       在用户流失调研中,以往的用户流失标准定义为用户没有再进行续费的时候(即使催缴信息通知后),而现实中用户未必是消费殆尽时才流失,而是已经不再活跃的时候就已经流失了,这样的初始标准延迟了我们对流失用户进行干预的时间。所以,流失用户的标准应该定义为在一段时间内未进行收视、业务办理等行为的用户。

1、数据选取

       本次分析的对象是2019年3月份用户状态变为欠费停机、主动停机、主动销户,并且4、5月份未复通的电视用户和部分目前仍为正常的电视用户。

       相关数据是选取用户的基础信息(安装地址等)、1年内的工单数据(故障、投诉、咨询等工单信息)、3个月的收费数据(缴费、托收等各渠道支付信息)、6个月的办理记录数据(缴费、办理业务等信息)及用户前5个月电视收视行为数据。

2、分析目标

       针对用户流失导致市场份额减少、营销成本增加、收入降低的问题实现以下目标:

  1. 从分布分析、对比分析、统计分析、相关性分析等方法分析挖掘用户特征情况;
  2. 利用聚类和分类算法构建用户流失预警模型,预测出最可能流失的用户名单。提高挽留成功率,降低流失率,帮助有效挽留方案的制定。

3、用户特征分析

3.1 基本情况分析

       本次对13241个用户做用户特征分析,其中8000个为正常的用户,5241个为3月份的流失用户,主动暂停用户占流失用户的47%。

       流失率是最能代表各区域流失情况的指标之一。我们从经分报表中提取3月份各分公司的在网用户数,然后分别计算各分公司的流失比例。如图 1所示。

1

3.2 用户收视数据分析

       收视方面,在基于业务对频道名称、节目名称、类型等数据的清洗;删除重复数据、无效数据和时间异常数据后,使1200万左右的收视数据处理为约800万条有效收视数据。

       首先将流失用户和正常用户的收视时长分布绘制出,如图2所示。发现收视时长低于500小时的流失用户数比收视时长低于500小时的正常用户数比例高,并且流失用户曲线比正常用户曲线斜率变化速度快,即两极化凸显,更加说明两者的用户收视时长差距较大。

2

       其次,在收视方面除了收视时长以外,还有一个明显的特征:用户在线天数,即用户的开机率。目前全网的月平均在线天数为15天。而本次用户5个月的在线天数如图3所示。可以发现流失用户与正常用户的分布有明显区别,流失用户低于75天的占比在69%左右,而正常用户在45%之后在线天数就已经高于75天;正常用户的在线天数分布整体呈凸线趋势,而流失用户的在线天数整体呈凹线趋势。

 图 3

3.3 消费情况分析

       消费方面,用户3个月的账单总体情况如图 4所示。无论是正常用户还是流失用户,大体的消费能力基本都属于50~200之间,同时存在少量高消费用户,这种分布是与产品销售制定的策略、方案有关。单单从数据的角度来看,消费的特征没有直接的影响用户的流失,但很可能是用户流失的附加考虑因素之一。

4

 

Python用户流失系列文章一月一更!

 

文章未经博主同意,禁止转载!

  • 1
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值