数据挖掘模型的深入-客户流失分析(2)

接  数据挖掘模型的深入-客户流失分析(1)
----
step4-模型建立:流失模型是典型的学习模型,有几个常用方法可以选-决策树、逻辑回归(有人会尝试神经网络,不利于应用和解释,也可以试试看)。
决策树的特点:适用布尔、分类和连续的变量(对连续变量也会内部转化为分类变量)、结果容易解释、筛选变量快;但决策树不稳定,容易训练过度(在训练时看起来很准确,但应用时预测准确率大打折扣)
逻辑回归的特点:逻辑回归的底层思想和多元回归接近,延续了回归算法不温不火的稳定风格,相比回归算法,logistic回归不要求变量有正态分布和等协 方差前提,也可以尝试着用哑变量来融入分类变量,使用更方便,但逻辑回归准确率相对较低(所谓成也萧何,败也萧何)。和决策树相比,回归算法稳定性好的多
我习惯于:
1、使用决策树进行变量范围筛选
2、使用逻辑回归进行预测
3、个别时候尝试着用因子分析进行变量转载(我试过的模型,有时候有一点点小的提升,和变量共线性特点有关,但不会有超乎意料的收获)

step5-模型解释:我们进入了最具挑战性的阶段,这个阶段会受前面的过程中是否有很多业务思考影响,也会直接导致模型应用的成功与失败
1、变量的解释目的有2个:给业务使用方信心、推动模型的应用
2、在选择变量时多构造些容易被解释的变量
3、在筛选变量的过程中,应该去从业务角度对去留的变量进行思考,可能这样做对准确率提升帮助不大,但对模型解释非常有利
4、花多一点时间把模型的结果和业务问题做对应,好好思考下为啥xxx这样的变量留下了并且importance这么高
5、尽量使用用户可以听懂和看懂的东西讲解给用户(决策树绝对是解释模型的上选)
6、在准确率的解释上,不要太强调技术指标,讨论下准确率和盖全率就完全ok,如果能把这些指标解释为成本和收益就更ok了

step6-模型应用:如果顺利通过了模型解释,这一步需求方会催着你,否则就是你催着根本不鸟你的需求方了,呵呵--想想别人是否想用你的模型,还是取决于模型解释过程中给你打多少分喽。
1、模型应用首先依赖于业务操作人员,一个漂亮的模型如果无法被业务人员使用、操作起来,而只停留在报告阶段,非常可悲
2、其次模型的应用依赖于系统:如果模型结果可以和系统工作量绑在一起,把流失预警结果直接生成任务,那模型就真的有价值了
3、要想应用好,必须吧模型解释关联到策略或行动:在细分的基础上做流失预警,非常有效,我们可以知道谁要流失,还能看到这个人特点,就可以行动了--举 个例子:如果医生告诉你你的病了,但不告诉你病因,是不是很痛苦,呵呵--流失预警好像我们知道谁生病了,细分就好比我们知道病因
4、模型应用时会后悔建模在工程上的实施性:假设建模时用了非常复杂的变量,模型实施时一定有人会出来和你对着干--太复杂的计算参与模型,虽然在数据准 备是一次性ok,但应用的时候每期都要运行,还是有压力(尤其是每天运行的时候,如果打分变量都算不出来,模型没法被应用)

step7-模型调整:如果你经过了step6才进行模型调整那说明模型在应用中出现了一些问题,恭喜你;否则说明模型没有上线就被质疑了,呵呵
1、模型应用后的调整是很幸运的事情,说明模型在被人关注。非规则模型一般不会调整,模型至少运行了数据准备时间窗口后才可能被调整,否则调整就是过拟合 (例如用过去6个月的数据建模,那模型一般运行6个月以上才有可能要调整);规则类的模型,可能随着规则前提的变化被动调整(例如:新入网某些套餐的用户 流失率高,如果那些套餐不再接纳新入网用户,模型就没有前提保证了,调吧,没办法,早知道不选这个变量了,呵呵)
2、模型还没有应用就调整,有2个原因:其一是模型准确率太低(其实在top20%的群体有4-5倍提升率是比较困难的),准确率低一般不是技术问题(除 非你技术实在太菜了),不要幻想着换牛逼方法对准确率有本质提升,只能看看业务上是否有很大疏漏,或者尝试着换个说法解释给需求方;其二是模型解释不被用 户认可--呵呵,找个业务专家一起讨论一次,你会有很大收获
3、模型调整有几种方式:根据业务情况重新界定和调整变量(你是否由于业务理解不足,缺一些重要变量)、在变量处理过程中对默认值和极值容错来提升模型 (对于回归等模型这个比较重要,对决策树没关系)、对模型的建模对象进行分割(例如:对用户化妆品偏好建模时,把男人女人一起建模是不是很愚蠢啊,那就建 2个模型呗,呵呵)

打完收工

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/8739744/viewspace-628791/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/8739744/viewspace-628791/

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值