python数据分析与机器学习-用户流失预警

python数据分析与机器学习-用户流失预警

    本文针对某网站游戏用户数据,运用python、pandas、matplotlib及sklearn,对初始数据进行数据清理,并结合机器学习的一些算法,建立关于用户流失预警的简单模型,重点是模型评估指标,可作为入门机器学习的小案例。

1.加载数据,查看数据特征,分析特征。


2.删除无用特征,处理字符型特征及样本标签(可参考贷款申请利润最大化),将数据标准化,消除量纲对机器学习建模的影响,这里使用sklearn自带的数据标准化函数。

3.由于本案例样本数目有限,建模时采用交叉验证的方式,首先建立模型训练函数,便于后期更换机器学习算法时直接调用。

4.接下来考虑模型效果评估指标,一般情况下采取precision进行模型效果评估,但考虑本案例是用户流失预警,其需求为:对于流失用户,我们预测的准确率应该更高才更合适,即考虑召回率recall,故引用混淆矩阵。

5.下面是运用SVM,RF,KNN算法训练出的模型的精度,召回率以及相应的混淆矩阵。


总结:以上结果显示,Random forest算法训练的模型精度以及召回率都相对较好,可在此算法的基础上对模型进行调优改进。调优方式可参考上篇贷款申请利润最大化,如通过上采样均衡样本数量,增加新的特征等。

  • 3
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值