1. 写在前面
最近的任务需要用到排序性的模型了,也就是LearningToRank的排序算法,关于这种排序算法, 预测的目标并不是点击或者不点击这样的二分类问题, 而是一个列表的整体排列顺序,是一种list-wise的方法,有时候更加符合推荐的场景。之前也整理过一篇文章, 具体的可以参考。
说到排序结果, 必然需要有指标用于评价排序结果的好坏,所以这篇文章的话主要是整理搜索排序里面用到的常用评价指标,比如我们常听到的MRR(Mean Reciprocal Rank), MAP(Mean Average Precison), NDCG(Normalized Discounted Cumulative Gain), RC(Rank Correction)等, 之前学习的时候, 如果不用会发现很快就忘记怎么算,尤其是NDCG这个, 感觉好难懂的样子,所以这次想把这些都整理到一块, 进行对比和强化理解, 也方便以后的回看。
看完这些, 再也不要说不懂排序的评价指标了哈哈,下面开始:
2. 精确率&召回率&F1值&AUC
这些内容, 这里就不整理了,这几个主要是评价二分类问题中模型的性能好坏, 我之前已经有非常详细的一篇文章进行梳理, 这里面最重要的就是AUC, 这个计算一定要会, 计算代码也得会手撸, 具体参考: