力争用最通俗易通的方法讲解看起来高深的概念。
查阅的很多博文,在讲述这四个概念的时候,都是开局一张图,后面全是互相抄一堆概念公式,或者是讲过去讲过来讲不到重点上,有什么意义。直接通过讲例子的方式一下就能将这些概念分辨清楚。
所有的概念都基于上面这张图,第一排表示数据集中真正有的目标,两个苹果,三条狗,四只猫。
第二排表示对应的检测结果:检测出一个苹果并且检测正确,检测出一条狗并且检测正确,检测出三只猫,有两只检测正确,有一只检测错误。
Presion:这个单词的意思是正确率,表示在所有检测到的目标中,检测正确所占的比例 = (两只正确的猫+ 一只正确的狗+ 一个正确的苹果)/ 所有检测到的目标 =(2+1+1)/ 5 = 0.8 。
Recall:单词意思是召回率,可以理解为找回率,还得是正确的找回,基于这个理解,可以深刻的记住Recall的公式,Recall表示 检测正确的目标占所有目标的比例 = (一个苹果 + 一条狗 + 两只猫)/ (两个苹果 + 三条狗 + 四只猫) = 4 / 9
上述没有考虑 阈值 ,如果要考虑阈值,将 低于阈值的 检测结果 剔除掉就行了。