推荐系统二分类任务之评价指标

最新推荐文章于 2022-04-20 23:05:00 发布

dreamfantacy

最新推荐文章于 2022-04-20 23:05:00 发布

阅读量1.3k

点赞数 1

分类专栏：推荐系统文章标签：推荐系统二分类 auc logloss

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dreamfantacy/article/details/102565163

版权

本文详细介绍了推荐系统中二分类任务的评价指标，包括AUC、Logloss及其重要性。AUC作为衡量分类器好坏的重要标准，通过ROC曲线的面积来评估。Logloss则用于度量模型预测概率与实际结果的吻合程度。同时提到了校准(calibration)指标，用于评估预测概率分布与实际CTR的接近程度。

摘要由CSDN通过智能技术生成

推荐系统CTR预估之评价指标

推荐系统二分类评价指标

本文重点介绍推荐系统的二分类预估评价指标。二分类，即只有正样本和负样本两种情况。
常用的评价指标有Precision，Recall，F1-score，AUC，Logloss，Normalized Logloss，Calicration等。其中，AUC是最常用，也是最重要的评价指标。下面，将对这些评价指标简单介绍。

如果我们对一个样本进行分类，会有4种情况，分别是：
$T P$ : 真正例（正样本，且被预测为正样本）
$F P$ : 假正例（负样本，但被预测为正样本）
$T N$ : 真负例（负样本，且被预测为负样本）
$F N$ : 假负例（正样本，但被预测为负样本）

准确率precision

在所有预测为正的样本中，有多少是真的正样本，衡量的是检索系统的查准率。公式可写为：
$\frac {TP} {TP+FP}$

召回率recall

在所有正样本中，有多少预测正确了，衡量的是检索系统的召回率。公式为：
$\frac {TP} {TP+FN}$

准确率和召回率是互相影响的，理想情况下肯定是做到两者都高，但是一般情况下准确率高、召回率就低，召回率低、准确率高，当然如果两者都低，那是什么地方出问题了。
如果是做搜索，那就是保证召回的情况下提升准确率；如果做疾病监测、反垃圾，则是保准确率的条件下，提升召回率。
也引入了准确率和召回率的综合指标，即F1-Score。

F1-Score

precision和recall的折中指标,公式为：
$F_1 = \frac {2*P*R} {P+R}$

AUC（Area under curve）

即曲线下面积，这里说的曲线，即ROC曲线。如下图所示：

在这里插入图片描述
该曲线的纵坐标是真正例率（TPR），横坐标是假正例率（FPR）。
$\frac {TP} {TP + FN}$
表示在所有正样本中，正确预测的比例。也就是前面提到的召回率。

$\frac {FP} {FP + TN}$

最低0.47元/天解锁文章

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。