由于最近在作图像检索。那么就有一个评价指标的问题。在网上一搜,尼玛,跟念经的一样。晦涩难懂。
这里,用一个实例说明。
1、背景
假设现在医院有医生给人测血糖,共100人。为了方便,我们分两类人,不正常(N),正常(P)。
groundtruth: 不正常(30),正常 (70)。
doctor predict: 不正常(40),正常(60)。
实际山,和这个预测的高血糖中真正高的,有24人。那16人不高。
预测正常的人真正正常的有54人,那6个人高血糖。
True Positive:我们把这个词分成两部分,true。说明医生测对了。Positive,说明测试结果是正常。
其余的类似。这两个词都是针对预测结果而言的。
2、建模
现在我们做混淆矩阵(Confusion Matrix)
、 | groundtruth=Positive | groundtruth=Negative |
---|---|---|
predict=Positive | True Positive |