留住已有的用户胜过拓展新的客户。用户留存和用户流失是一组相对的概念。获得一个新客户的成本要远远高于保持一个老客户的成本。所以说提升用户的留存减少用户的流失是必不可少的。用户留存依然是反映企业及产品核心竞争力的关键要素。通过这种方式发现将要流失的用户,用各种福利(大礼包,打电话,优惠卡等)来挽留此类用户.
一、基础知识
1、混淆矩阵
混淆矩阵是用来总结一个分类器结果的矩阵。对于k元分类,其实它就是一个k x k的表格,用来记录分类器的预测结果。对于最常见的二元分类来说,它的混淆矩阵是2乘2的,如下:
- TP = True Postive = 真阳性;
- FP = False Positive = 假阳性
- FN = False Negative = 假阴性;
- TN = True Negative = 真阴性
真实值:0 1 1 0 1 1 0 0 1 0 1 0 1 0 0
预测值:1 1 1 1 1 0 0 0 0 0 1 1 1 0 1
精确率:正确的选择除以总的选择:TP/(TP+FP)
召回率:已经召回的/已经召回的+还未召回的:TP/(TP+FN)
准确率:预测对的/总的;(TP+TN)/(TP+FN+FP+TN)
一、用户流失预警分析
- 数据获取:通过一个月用户数据的统计,标签字段中False说明我们这个用户确实流失了,True表示还没有流失.
- 特征工程:使用pandas中的read_csv将数据导入,理解字段、筛选字段、填充字段、编码字段、特征衍生、字段拆分、数据的归一化和标准化。
- 切分数据集,使用KFord进行k折交叉验证,使用现有的数据集训练不同的模型。
针对用户增长分析,从用户防流失的角度,基于多点app电商构建用户流失预警模型,找到高潜流失用户。用于定向开展运营激活,从而有效控制用户流失风险,提升大盘用户的留存率和活跃度。(不要便宜羊毛党)