跨模态检索评价指标，pr曲线，map_跨模态检索精度-CSDN博客

本文链接：https://blog.csdn.net/weiyuxin107/article/details/120681393

本文详细介绍了跨模态检索的评价指标，包括精确率、准确率、召回率和混淆矩阵，并提供了相关代码示例。此外，还讲解了在检索任务中的平均精度（AP）和map@k的计算方法，以及如何利用PR曲线和Precision-Scope曲线评估模型性能。通过Python代码展示了如何绘制这些曲线，以评估和比较检索模型的效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

跨模态检索评价指标

精确率，准确率，召回率，混淆矩阵

以二分类算法为基础

TN：算法预测为负例（N），实际上也是负例（N）的个数，即算法预测对了（True）；

FP：算法预测为正例（P），实际上是负例（N）的个数，即算法预测错了（False）；

FN：算法预测为负例（N），实际上是正例（P）的个数，即算法预测错了（False）；

TP：算法预测为正例（P），实际上也是正例（P）的个数，即算法预测对了（True）

混淆矩阵

	预测值 0	预测值 1
真实值 0	TN	FP
真实值 1	FN	TP

准确率： $\frac{(TP + TN)} { (TP + TN + TP + FN)}$ 预测正确的总数/总样本数
精确率： $\frac{TP} {(TP + FP)}$ 预测值为1且正确的数目/预测为1的总数
召回率： $\frac{TP} { (TP + FN)}$ 预测值为1且正确的数目/真实值为1的总数

代码，使用sklearn.metrics中的confusion_matrix

from sklearn.metrics import confusion_matrix
label = np.random.randint(0, 3, (1,5)).squeeze(0)
predict = np.random.randint(0, 3, (1,5)).squeeze(0)

label = array([1, 1, 0, 1, 2])

predict = array([0, 2, 0, 0, 2])

cf = confusion_matrix(label, predict).astype(float)

预测: 0 1 2 标签

array([[1., 0., 0.], 0
[2., 0., 1.], 1
[0., 0., 1.]]) 2

# 准确率
acc = np.diag(cf).sum()/cf.sum()    

# 精确率
per = np.diag(cf)/cf.sum(axis=0) # 按列求和

# 召回率
rec = np.diag(cf)/cf.sum(axis=1) # 按行求和

评价指标的论文：paper

map

mean average precision，平均精度

检索任务的percision、recall和分类任务的略有不同。分类任务中使用预测分数排序，检索任务中使用特征的近似度排序。

$\frac{\sum_{i=1}^{k} \operatorname{Re}_{i}}{k}$