策略产品函数方法论——评估

机器学习常用性能指标及sklearn中的模型评估一文中已对相对宏观的模型评价指标进行了描述,并给出了在sklearn中具体的实现方法,主要包括准确率、精确率、召回率,ROC曲线,那在策略产品工作中,如何进行业务函数的评估?

1. 评估前的样本切分

与机器学习模型评估步骤相同,将样本数据切分为训练集、验证集和测试集。

2. 常见的模型评估指标

2.1 基于二分类问题的混淆矩阵定义的指标

包括准确率、精确率P、召回率R,同时考虑业务对Precision与Recall指标的侧重性,常用F1值\frac{2PR}{P+R}即精确率P与召回率R的调和平均数。

2.2 ROC曲线和AUC

横坐标为假正率,纵坐标为真正率的曲线称为ROC曲线,用曲线下方的面积AUC对模型本身做出评估。

AUC=1,分类模型的完美状态,基本不存在;

0.5<AUC<1,得分越高则模型越有效,但越接近1时要考虑过拟合问题。

2.3 Lift曲线和K - S曲线

 该部分是一些与业务指标联系更为密切的指标。

Lift曲线描述不同分类阈值下模型的精确率与先验精确率的比值,衡量的是一个模型对目标中“响应”的预测能力优于随机选择的倍数;来自模型和策略效果衡量常用指标——LIFT提升度

K - S主要用来验证模型的区分能力,实际上就是把分类阈值作为横坐标,TPR和FPR值同时作为纵坐标,真正率和假正率的差值越大则模型能够尽可能多的正确区分正负样本。

2.4 MAE、MSE和RMSE

对于回归问题,常使用平均绝对误差、均方误差及均方根误差来评估预测的结果与真实结果之间的差异。

MAE = \frac{1}{N} \sum_{i=1}^{N}\left | f(x_{i})-y_{i} \right |

MSE = \frac{1}{N} \sum_{i=1}^{N} (f(x_{i})-y_{i} )^{2}

RMSE = \sqrt{MSE}

2.5 MAP和nDCG

对于搜索、推荐等业务场景需要额外关心返回结果的排序,对排序结果的评估通常使用MAP和nDCG来衡量。

参考1:https://zhuanlan.zhihu.com/p/274563041

参考2:https://www.jianshu.com/p/ff0eb70d31ec

参考3:《策略产品经理——模型与方法论》

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值