用户流失模型:
http://www.newnorth.com/creating-a-predictive-churn-mode-part-1l/
Creating a Predictive Churn Model : Part 1
【编者按】这是张磊博士2008年在数据挖掘研究院论坛上针对heilql的一篇回帖,主要针对当时电信离网用户预测模型阐述一下自己的看法,转眼5年过去,统计网仅以此贴向曾经的数据前辈们致敬。
我曾经看过所谓预警模型,只是对一些指标设定阈值,然后多个指标加权评分之后,得到总预警评分,若超过阈值,则提出预警。理论背景
客户流失分析或客户流失预测:通过离网调研和数据挖掘,捕捉客户离网前的特征,预测客户流失的概率。这对于优质客户的保护是十分重要和有效的分析手段。对于客户流失预测,从两个方面来看:一个是客户流失预警,一个是流失客户特征分析。
客户流失预警:定义统一的预警模型,根据预警模型,客户话单数据中自动匹配预警数据,预警模型可以按如下规则定义,并且可以灵活扩展。
流失客户特征分析:通过决策数算法,分析流失客户特征,然后通过这些特征得到当前在网客户中匹配流失概率高的客户数据。
通过客户流失分析获得流失客户数据和潜在流失客户数据,从而将这些数据分配给客户服务部门,整合销售服务资源,根据客户的需求,设计个性化的营销策略,快速反应,以此达到召回流失客户,挽留流失概率高的客户,实现对客户的守护。
现实背景
随着电信行业竞争的加剧,客户流失的规模越来越大,周期越来越短;电信业新增客户和客户流失模式,就犹如往没有底的水桶中倒水。
分析方法
客户流失分析的流程到处都在讲,不外乎是:
1. 分析主题确定及数据指标的选择;
2. 数据仓库数据提取及清洗;
3. 不相关指标剔除;
4. 用训练数据建立模型;
5. 用测试数据检验模型;
6. 预测新的流失用户,并提取用户名单;(摘自heilql原帖)
问题在于:这种思路有些一刀切,指标的选取和阈值的设定都存在很大的人为性,也缺乏有效性评估,所以个人觉得没有太大的实践价值。
再谈流失预测分析,业界普遍都是采用决策树算法来建立模型。同意heilql的一些看法,包括挖掘流程的大致描述、指标选择是重点等。其实在我们以前所做的多个客户流失预测项目中,更重要的还有:明确业务问题的定义和如何运用挖掘结果来指导客户挽留活动。以下分别简要说明:
<