学习笔记 --- 目标检测性能评价指标MAP、FLOPs

本文链接：https://blog.csdn.net/weixin_48592526/article/details/120238619

通常我们去评价一个模型时，首先看的应该是它的精确度，当你精确度不行的时候，你和别人说我的模型预测的多么多么的快，部署的时候占的内存多么多么的小，都是白搭。但当你模型达到一定的精确度之后，就需要更进一步的评价指标来评价你模型：
1）前向传播时所需的计算力，它反应了对硬件如GPU性能要求的高低；
2）参数个数，它反应所占内存大小。
为什么要加上这两个指标呢？因为这事关你模型算法的落地。比如你要在手机和汽车上部署深度学习模型，对模型大小和计算力就有严格要求。

IOU定义与计算

https://github.com/amusi/Deep-Learning-Interview-Book/blob/master/docs/%E8%AE%A1%E7%AE%97%E6%9C%BA%E8%A7%86%E8%A7%89.md#iou

mAP定义与计算

https://github.com/amusi/Deep-Learning-Interview-Book/blob/master/docs/%E8%AE%A1%E7%AE%97%E6%9C%BA%E8%A7%86%E8%A7%89.md#map

关于IOU的疑问：

iou只能用来判断预测预测的位置准不准确，但是目标检测除了预测位置准不准确外，还需要判断预测的类别和gt（ground truth）类别是否对应呀。
现在我拿出一张图片中所有要计算AP的类别的检测框，计算与Gt对象检测框的iou，若iou大于阈值，则视为TP，若预测框中的实际对象不是要计算AP值的那个类别，但预测的标签是要计算AP的那个类别，且预测框与gt对象的框iou也大于阈值，那么这种情况判读为TP，明显是错误的。

其实这种情况基本不可能发生：
1、源码中：if not R[‘difficult’][jmax]，将难检测的目标去掉了（个人觉得这里主要去除的是被遮挡面积较大的检测对象，也就是2个不同类别的物体重叠干扰的情况）
2、假如框中实际对象与要GT的类别不匹配，你预测的此类别的置信度分数不会很高，然后在统计TP的时候，置信度分数高的检测结果先去判断是否是TP
3、即使假设你是剩下预测中置信度分数最高的，你与其他目标的GT的IOU还要超过阈值
以上三点每一样都基本很难满足，更别说三点都满足了，所以说这样做是一点问题没有的。