目标检测算法汇总比较

最新推荐文章于 2025-10-02 20:47:19 发布

转载最新推荐文章于 2025-10-02 20:47:19 发布 · 1.6w 阅读

文章标签：

37 篇文章

订阅专栏

作者：金天
链接：https://zhuanlan.zhihu.com/p/39579528
来源：知乎
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

很难衡量一个检测算法的好坏，因为除了算法本身的思路之外，还有许多因素影响它的速度和精度，比如：

为了对比不同的算法，可以不考虑上述的所有影响因素，直接对论文结果评测，应该能大体看出不同方法的速度差异。

上图是一个所有方法的预览。从图中可以看出RFCN的准确度是最高的。

上图可以看出，速度最快的还是yolo和SSD一体化的方法。

这是在ms-coo数据集上的测试效果，从效果可以看出，Retina-Net在mAP效果是最好的。其中Faster-RCNN改用Resnet作为特征抽取网络准确率有较大的提升。

最后是Google做的一个research，在TensorFlow上统一的实现了所有的检测算法，yolo没有包含在内。最终的测试结果可以表示为：

从上面可以大致的看出，Faster-RCNN的准确度更加精确，而RFCN和SSD更快。

上述只是一个预览，但是除了这些之外，我们还需要考虑一些更加细化的因素。

特征抽取网络不通，最终的结果也不同。简单来说，一个更加复杂的特征抽取网络可以大大的提高Faster-RCNN和RFCN的精确度，但是对于SSD，更好的特征抽取网络对结果影响不大，所以你看SSD+MobileNet也不会太大的影响结果。从这个图可以看得很清楚：

对于大物体，SSD即使使用一个较弱的特征抽取器也可以获取较好的精确度。但在小物体上SSD的表现结果非常不好。

具体来看，SSD在一张图片里面就经常漏检测小物体，比如：

不同的Proposal数目会影响检测器的速度和精度。这个很重要，很多人想加速Faaster-RCNN但是不知道从何下手，显然这里是一个很好的切入点。将Proposal的数目从300削减到50，速度可以提高3倍，但是精度仅仅降低4%，可以说非常值了。我们从这张图可以看得很清楚：

最终我们可以得到一个很科学的结果：

使用Faster-RCNN毫无疑问，使用Inception ResNet作为特征抽取网络，但是速度是一张图片1s；还有一种方法是一种叫做集成的动态选择模型的方法（这个你就不要追求速度了）；

SSD+MobileNet是速度最快的，但是小目标检测效果差；

10 条评论