Google Landmark Recognition 2020 的评价指标
当K = 1 时,该评价指标也叫micro Average Precision
对于每个测试图像,模型将预测一个地标标签和一个相应的置信度得分。 评估将每个预测视为一长串预测(按置信度分数按降序排序)中的单个数据点,然后根据该列表计算平均精度。 按置信度得分降序排列排列,并根据此列表计算Average Precision 。
如果提交具有 N 个预测(标签/置信对),并按它们的置信度得分从高到低排序,则全局平均精度(Global Average Precision, GAP)的计算公式为:
N:系统在所有查询中返回的预测总数
M:是查询集合总数中至少有一个样本可见的查询总数(请注意,某些查询可能未描述样本)
P(i):是rank i的Precision。 (例如:考虑rank3-有3个预测,其中2个是正确的。那么P(3) = 2/3)
rel(i):表示预测i的相关性:如果第i个预测正确,则为1,否则为0