结合maskrcnn和yolo的优缺点，建立灵活的包含两种模型的目标检测模型图像难度预测器

最新推荐文章于 2024-08-12 17:02:43 发布

heavenpeien

最新推荐文章于 2024-08-12 17:02:43 发布

阅读量1.2w

点赞数 7

文章标签：目标检测

本文链接：https://blog.csdn.net/heavenpeien/article/details/80020319

版权

本文提出了一种利用图像难度预测器的方法，通过预判图像难度来智能地结合two-stage的Mask R-CNN和single-stage的YOLO目标检测器，以达到精度和速度的最佳平衡。在PASCAL VOC 2007数据集上的实验结果显示，此方法的性能与随机分配图像给不同检测器相当，且具备灵活性，可按需调整图像分类阈值。

摘要由CSDN通过智能技术生成

主要有两种类型的最先进的物体探测器。一方面，我们two-stage探测器，比如Faster R-CNN（基于区域的卷积神经网络）或Mask R-CNN，它们（i）使用区域提议网络在第一阶段产生兴趣区域，（ii）将区域提案发送到pipeline中以进行对象分类和边界框回归。这样的模型达到了最高的准确率，但通常较慢。另一方面，我们有YOLO（You Only Look Once）和SSD（Singe Shot MultiBox Detector）等single-stage探测器，将物体探测作为一个简单的回归问题，它将输入图像作为输入图像并学习类概率，边界框坐标。这种模型的准确率较低，但比two-stage物体探测器快得多。在本文中，我们建议使用图像难度预测器来实现目标检测中精度和速度之间的最佳平衡。将图像难度预测器应用到测试图像上，将其分解为简易图像和困难图像。一旦分离后，简单的图像将被发送到更快的single-stage探测器，而困难图像被发送到更精确的two-stage探测器。我们在PASCAL VOC 2007上进行的实验表明，使用图像难度与图像的随机分割相比毫不逊色。我们的方法