前言
最近想起总结一下常用的推荐指标了,觉得这也是最基础的知识点吧。不过这个也不是很全,只是将一些我认为基础的常用的进行了一下总结,后续在任务中遇到其他的再进行补充吧。
比如我们常听到的AUC, MAP(Mean Average Precison), HR(Hit Ratio),NDCG(Normalized Discounted Cumulative Gain),等。
1、ROC与AUC
这些内容, 这里就不整理了,这几个主要是评价二分类问题中模型的性能好坏, 我之前已经有非常详细的一篇文章进行梳理, 这里面最重要的就是AUC, 这个计算一定要会, 计算代码也得会手撸, 具体参考:
通过这两篇文章, 应该可以把ML里面常用的评估指标和损失函数给拎起来, 这里面分类的重点就是AUC, 这个面试一般必考。下面开始介绍另外一些指标, 下面这些,主要是衡量的推荐列表topK的评价了。
2、 Hit Ratio(HR)
在top-k里面,HR是一种常用的衡量召回率的方式,也是很容易理解的一种排序方式。先看一下计算公式:
分母是所有测试集合, 分子表示每个用户top-K列表中属于测试集合的个数总和。举个简单的例子,三个用户在测试集中的商品