建立流失玩家预测模型之初,对于P值和F值不是非常理解,后来随着模型的建立,清楚了P值和F值的意义,结合实际业务,对这两个值进行权衡。
P值,英文为precision,准确率。
R值,英文为recall,召回率。
实例:测试集有1万玩家,模型判定结果如下。
模型判定流失玩家 | 模型判定未流失玩家 | |
实际流失 | 实际流失且模型判定为流失:800人 | 实际流失模型判定为未流失: 600人 |
实际未流失 | 实际未流失模型判定流失: 200人 | 实际未流失模型判定未流失: 8400人 |
P=800/(800+200)=80%
R=800/(800+600)=57%
由上面得出:如果模型表现为这样的效果,其实是非常不理想的,针对流失预测模型,如果P值过低,说明判定为流失的玩家,有很多没有流失,会增加运营的成本。另一方面,如果R值过低,则说明有很多流失玩家没有识别出来,这样就失去了建立此模型的意义。所以综合权衡,要保证R值较高,近可能识别出流失用户,在此基础上兼顾好准确率。