时态知识图谱补全推理任务评价指标

sauTCc

于 2025-03-02 12:53:01 发布

阅读量630

点赞数 7

分类专栏：知识图谱文章标签：知识图谱人工智能

本文链接：https://blog.csdn.net/qq_52071659/article/details/145961839

版权

6 篇文章

订阅专栏

在知识图谱（KG）或时序知识图谱（TKG）的链接预测任务中，MRR（Mean Reciprocal Rank） 和 Hits@k 是两种常用的评估指标。它们用于衡量模型预测的正确事实在候选答案中的排名质量。以下是它们的计算过程详解：

MRR 是正确事实的排名的倒数的平均值。它反映了模型将正确事实排在靠前位置的能力。

对每个查询计算 Reciprocal Rank（RR）：
- 对于一个查询（如 ((s, r, ?, t))），模型会生成一组候选答案，并按照预测分数对它们进行排序。
- 找到正确事实的排名 (rank)（即正确实体 (o) 在排序列表中的位置）。
- 计算 Reciprocal Rank：
  - 如果正确事实排名第一，(RR = 1)；
  - 如果排名第二，(RR = 0.5)；
  - 以此类推。
对所有查询的 RR 取平均：
- 假设有 (N) 个查询，每个查询的 Reciprocal Rank 为 (RR_i)，则 MRR 计算公式为：

假设有以下 3 个查询及其正确事实的排名：

则 MRR 为：
[
MRR = {0.5 + 1.0 + 0.2}/{3} = 0.5667
]

Hits@k 表示正确事实的排名在前 (k) 位的比例。它反映了模型将正确事实排在前 (k) 位的能力。

对每个查询检查正确事实是否在前 (k) 位：
- 对于一个查询，模型生成一组候选答案并排序。
- 如果正确事实的排名 rank < k，则记为 1；否则记为 0。
对所有查询的结果取平均：
- 假设有 (N) 个查询，其中 (M) 个查询的正确事实排名在前 (k) 位，则 Hits@k 计算公式为：