通信运营商客户流失预测

通信运营商客户流失预测

一、背景

客户流失是电信行业最重要的服务方面之一。客户流失的广义说法是因为客户自己或运营商违反服务协议而终止客户服务的行为。 然而,客户流失的最主要和最常见的原因是由于客户对运营商的服务不满意或其他运营商提供了更为优惠的价格。 目前,中国的手机用户已经接近13亿,固定宽带用户数累计达到2.9亿,随着市场竞争的日益加剧和市场需求的逐渐饱和,客户以更低的价格就可以享受更好的服务,宽带用户发展已经受到越来越大的竞争压力,增量市场发力不足,存量市场流失日趋严重。因此,减少客户流失、延长宽带用户的生命周期,成为当期电信宽带发展的重中之重。

二、定义

1.什么是ROC曲线
很多学习器能输出一个实值或者概率预测,然后设定一个阈值,高于阈值为正类,反之负类。
分类的过程就是设定阈值,并用阈值对预测值做截断的过程,当这个阈值发生变动时,
预测结果和混淆矩阵就会发生变化,最终导致一些评价指标的值的变化。
2.ROC曲线的两个指标
1)真正例(True Positive Rate,TPR)
2)假正例(False Positive Rate,FPR)
3.ROC曲线的含义
以FPR为横坐标,TPR为纵坐标,那么ROC曲线就是改变各种阈值后得到的所有坐标点 (FPR,TPR) 的连线,
画出来如下。红线是随机乱猜情况下的ROC,曲线越靠左上角,分类器越佳。
4.什么是AUC
AUC(Area Under Curve)就是ROC曲线下的面积。
5.AUC的含义
首先AUC值是一个概率值,当你随机挑选一个正样本以及一个负样本,
当前的分类算法根据计算得到的Score值将这个正样本排在负样本前面的概率,
就是AUC值。当然,AUC值越大,当前的分类算法越有可能将正样本排在负样本前面,即能够更好的分类。

三、内容

  1. 数据读取:根据数据文件类型以及数据探索、数据处理和分类回归实验的要求,读取数据并处理为符合要求的格式。必须提供代码和结果截图
  2. 由于数据集中前面60W条没有提供结果,所以需要删除,大致还剩下30w左右的数据,你们自己选2-4W条进行这个任务。因为数据中涉及到一些中文或英文文本处理,你们直接在数据读取以后,把下面几列数据删除(MONTH_ID、USER_ID、AGREE_EXP_DATE、CONSTELLATION_DESC、MANU_NAME、MODEL_NAME、OS_DESC、TERM_TYPE),用删除后的数据完成后续任务
  3. 数据探索与数据处理:根据之前讲过的实验《数据探索》的内容,查看数据的基本统计特征情况和拓展统计特征情况,根据之前做过的实验《Pandas统计分析基础与数据预处理》中的内容,查看数据是否存在缺失值、异常值、重复值,如果存在,进行相应处理(这个具体怎么做之前给你们的材料里都有)。必须提供代码和结果截图
  4. 客户流失预测:按照实验《C6 回归模型与分类模型》中的数据处理和分类预测流程,以第三步中处理完成的数据作为本次分类预测实验的输入数据,分别使用SVM、梯度提升决策树GBDT、随机森林 三种分类方法(有兴趣的同学可尝试其他分类方法,不局限于我说的这三种)完成分类预测任务,记录预测结果,在同一个图片中展示三种算法的预测结果对比(三个模型的AUC数值使用柱状图进行对比展示“需说明每个柱体对应哪种类型的分类器”,使用ROC曲线展示三个模型的预测结果对比“需说明每个曲线对应哪种类型的分类器”)。

四、实验代码与结果

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

五、总结

对特征的处理方式问题,导致结果并不是非常的好,加入的人为主观因素过多。特征处理其实还有很多种方法,后面也会再仔细想一想,面对特征时应该要发散思维想到更多直接的处理方式。有些简单粗暴的处理方式可能会更好。还是对业务数据的不熟练。建模也只是那些很普遍的建模方式,并没有根据实际的数据特征去思考最佳的建模方案。

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

我慢慢地也过来了

谢谢大佬的投喂

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值