WAP（@R）指标

最新推荐文章于 2021-07-03 15:09:03 发布

HackerTom

最新推荐文章于 2021-07-03 15:09:03 发布

阅读量3.3k

点赞数 2

分类专栏：机器学习文章标签： WAP IR 指标 python numpy

本文链接：https://blog.csdn.net/HackerTom/article/details/109386884

版权

机器学习专栏收录该内容

120 篇文章 16 订阅

订阅专栏

本文介绍WAP（Weighted Average Precision）在信息检索中的应用，一种支持多值相似度的评价指标，扩展了mAP，并通过ACG计算公式进行详细解释。提供了一个计算WAP的Python代码示例，以及关于WAP@k取值策略的讨论。

摘要由CSDN通过智能技术生成

Notes

检索中常用几种评价指标：

WAP（Weighted mean Average Precision）在 [2] 提出，是 mAP 的扩展，支持多值相似度（multi-level similarity），基于 ACG。对于一个长为 n 的检索序列 V，有： $V)=\frac{1}{\sum_{p=1}^ns(q,V_p)}\sum_{i=1}^nACG@i(q,V)\cdot1(s(q,V_i)>0)$ 其中 $s(x,y)=\begin{cases}1, & x 与 y 相似 \\ 0, & x与y不相似\end{cases}$ 即传统 mAP 中用的二值相似度（binary similarity）。算 WAP@k 时，分母可能有两种取法：

前 k 个样本中相似样本数
所有样本中相似样本数

见 [3] 中 About the Denominator 一节。此处暂时（2020.10.30）采用与 [3] 一样的策略，即只算前 k 个，则 $V)=\frac{1}{\sum_{p=1}^ks(q,V_p)}\sum_{i=1}^kACG@i(q,V)\cdot1(s(q,V_i)>0)$

Code

# import numpy as np

def WAP(Dist, Rel, k=-1):
    """Weighted mean Average Precision"""
    n, m = Dist.shape
    if (k < 0) or (k > m):
        k = m
    Gain = Rel
    S = (Gain > 0).astype(np.int)
    pos = np.arange(k) + 1
    Rank = np.argsort(Dist)

    _WAP = 0.0
    for s, g, rnk in zip(S, Gain, Rank):
        # n_rel = s.sum()  # 算所有 m 个
        _rnk = rnk[:k]
        s, g = s[_rnk], g[_rnk]
        n_rel = s.sum()  # 只算前 k 个
        if n_rel > 0:
            acg = np.cumsum(g) / pos
            _WAP += (acg * s).sum() / n_rel

    return _WAP / n