结合maskrcnn和yolo的优缺点,建立灵活的包含两种模型的目标检测模型 图像难度预测器

本文提出了一种利用图像难度预测器的方法,通过预判图像难度来智能地结合two-stage的Mask R-CNN和single-stage的YOLO目标检测器,以达到精度和速度的最佳平衡。在PASCAL VOC 2007数据集上的实验结果显示,此方法的性能与随机分配图像给不同检测器相当,且具备灵活性,可按需调整图像分类阈值。
摘要由CSDN通过智能技术生成

主要有两种类型的最先进的物体探测器。一方面,我们two-stage探测器,比如Faster R-CNN(基于区域的卷积神经网络)或Mask R-CNN,它们(i)使用区域提议网络在第一阶段产生兴趣区域, (ii)将区域提案发送到pipeline中以进行对象分类和边界框回归。这样的模型达到了最高的准确率,但通常较慢。另一方面,我们有YOLO(You Only Look Once)和SSD(Singe Shot MultiBox Detector)等single-stage探测器,将物体探测作为一个简单的回归问题,它将输入图像作为输入图像并学习类概率,边界框坐标。这种模型的准确率较低,但比two-stage物体探测器快得多。在本文中,我们建议使用图像难度预测器来实现目标检测中精度和速度之间的最佳平衡。将图像难度预测器应用到测试图像上,将其分解为简易图像和困难图像。一旦分离后,简单的图像将被发送到更快的single-stage探测器,而困难图像被发送到更精确的two-stage探测器。我们在PASCAL VOC 2007上进行的实验表明,使用图像难度与图像的随机分割相比毫不逊色。我们的方法

  • 7
    点赞
  • 31
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值