图像标注的评价指标一般分为以词为标准的评价指标[CP(词查准),CF1(词F1)]和以图为标准的评价指标[OP(图查准),OF1(图F1)]
以MS-COCO数据集为例,数据集有80个类别,在验证集验证得到如下数据
其中Ng表示数据集中每一类标签的数量(TP+FN),Np 为数据集中每一类被预测为正样本的图像数量(TP+FP),Nc为数据集中每一类被预测为正样本并且预测正确的图像数量(TP)。
图查准如下:
图查全如下:
图F1如下:
词查准如下:
词查全如下:
词F1如下: