网上说的很多,但我看不懂…
解释下P,N,F,T
P,N:一张图片输入网络后,出来一堆的pred_box,这些box都有预测类别结果。Precision,Recall是按照类别来计算的,比如我整个网络包含,猫,狗,小鸟三个类别,我现在要计算猫这一类别的Precision,Recall。那么P就表示预测结果中预测类别为猫的样本,正样本。N就表示其他类别,狗和小鸟,都是负样本。(划重点,无论有多少剩余类别,都是负样本,这里网上老喜欢只说两个类别,误导性很强)
F,T:注意,这里的F,T不是上述P,N分类是否正确,而是 将pred_box(所有,P和N)与猫这一类别的gt box计算iou,大于阈值,即为T,小于阈值,F。注意,gt只使用当前正样本猫的gt,其余gt忽略。(划重点,也是我一直没搞清的地方)因为只使用正样本的类别的gt,所以自带分类效果。