推荐系统常用评价指标_推荐系统评价指标及计算公式-CSDN博客

转载于：https://blog.csdn.net/qq_40006058/article/details/89432773

1. 混淆矩阵

在这里插入图片描述
TP（true positive）：表示样本的真实类别为正，最后预测得到的结果也为正；
FP（false positive）：表示样本的真实类别为负，最后预测得到的结果却为正；
FN（false negative）：表示样本的真实类别为正，最后预测得到的结果却为负；
TN（true negative）：表示样本的真实类别为负，最后预测得到的结果也为负.

其中，TP与TN表示分类正确的样本。

2. 准确率

准确率表示预测正确的样本数占总样本书的比例。
$\frac{TP+TN}{TP+TN+FP+FN}$

3. 精确率

精确率表示预测为正样本的样本中，正确预测为正样本的概率。
$\frac{TP}{TP+FP}$

4. 召回率

召回率表示正确预测出正样本占实际正样本的概率。
$\frac{TP}{TP+FN}$

5. F1 score

折中了召回率与精确率。
$\frac{2*Recall*Precision}{Recall+Precision}$

6. ROC与AUC

ROC曲线的横轴为假正例率FPR(越小越好)，纵轴为真正例率TPR(越大越好)。
$\frac{FP}{TN+FP}$

$\frac{TP}{TP+TN}$

ROC计算过程：

1)首先每个样本都需要有一个label值，并且还需要一个预测的score值（取值0到1）;2)然后按这个score对样本由大到小进行排序，假设这些数据位于表格中的一列，从上到下依次降序;3)现在从上到下按照样本点的取值进行划分，位于分界点上面的我们把它归为预测为正样本，位于分界点下面的归为负样本;4)分别计算出此时的TPR和FPR，然后在图中绘制（FPR, TPR）点。

在这里插入图片描述

AUC的含义：测试任意给一个正类样本和一个负类样本，正类样本的score有多大的概率大于负类样本的score。或者，任意给定一个负样本，所有正样本的score中有多大比例是大于该负类样本的score

在这里插入图片描述

7. Hit Ratio(HR)

在top-K推荐中，HR是一种常用的衡量召回率的指标，计算公式为：
$\frac{NumberOfHits@K}{GT}$

分母 $G T$ 是所有的测试集合，分子表示每个用户top-K列表中属于测试集合的个数的总和。

举个简单的例子，三个用户在测试集中的商品个数分别是10，12，8，模型得到的top-10推荐列表中，分别有6个，5个，4个在测试集中，那么此时HR的值是 (6+5+4)/(10+12+8) = 0.5。

def hit(gt_items, pred_items):
    count = 0
    for item in pred_items:
        if item in gt_items:
            count += 1
    return count

8. Mean Average Precision(MAP)

平均准确率AP，假使当我们使用google搜索某个关键词，返回了10个结果。当然最好的情况是这10个结果都是我们想要的相关信息。但是假如只有部分是相关的，比如5个，那么这5个结果如果被显示的比较靠前也是一个相对不错的结果。但是如果这个5个相关信息从第6个返回结果才开始出现，那么这种情况便是比较差的。这便是AP所反映的指标，与recall的概念有些类似，不过是“顺序敏感的recall。

对于用户u uu，给他推荐一些物品，那么u uu的平均准确率为：

$AP_u = \frac{1}{Ω_u}\sum_{i \in Ω_u}\frac{\sum_j \in Ω_u h(p_{uj}<p_{ui})+1}{p_{ui}}$

其中， $\Omega _u$ 表示ground-truth的结果， $p_{uj}$ 表示 $i$ 物品在推荐列表中的位置， $p_{uj} < p_{ui}$ 表示 $j$ 物品在推荐列表中排在 $i$ 物品之前。

在这里插入图片描述

def AP(ranked_list, ground_truth):
    """Compute the average precision (AP) of a list of ranked items
    """
    hits = 0
    sum_precs = 0
    for n in range(len(ranked_list)):
        if ranked_list[n] in ground_truth:
            hits += 1
            sum_precs += hits / (n + 1.0)
    if hits > 0:
        return sum_precs / len(ground_truth)
    else:
        return 0