目标检测发展史

				版权声明:转载时,请务必注明文章出处网址,谢谢!					https://blog.csdn.net/Gentleman_Qin/article/details/84421435				</div>
							<link rel="stylesheet" href="https://csdnimg.cn/release/phoenix/template/css/ck_htmledit_views-f57960eb32.css">
							            <link rel="stylesheet" href="https://csdnimg.cn/release/phoenix/template/css/ck_htmledit_views-f57960eb32.css">
					<div class="htmledit_views" id="content_views">
            <p>论文名称:《&nbsp;Deep Learning for Generic Object Detection: A Survey 》</p>

论文下载:https://arxiv.org/abs/1809.02165

对应代码:https://github.com/hoya012/deep_learning_object_detection#2014


目标检测是计算机视觉领域的基本且重要的问题之一,而「一般目标检测」则更注重检测种类广泛的自然事物类别。近日,中国国防科技大学、芬兰奥卢大学、澳大利亚悉尼大学、香港中文大学、加拿大滑铁卢大学的研究者在 arXiv 发布了一篇综述论文《 Deep Learning for Generic Object Detection: A Survey 》,对用于一般目标检测的深度学习技术进行了全面系统的总结。

来自首尔国立大学的 Lee hoseong 在近期开源了「deep learning object detection」GitHub 项目,正是参考该论文开发的。该项目集合了从 2013 年 11 月提出的 R-CNN 至在近期举办的 ECCV2018 上发表的 RFBNet 等四十多篇关于目标检测的论文,相当全面。这些论文很多都曾发表在机器学习或人工智能顶会上,如 ICLR、NIPS、CVPR、ICCV、ECCV 等。正如图中红色字体标示的那样,其中也包含了很多代表性的成果,如从 R-CNN 到 Mask R-CNN 的 R-CNN 系列、YOLO 系列、RPN、SSD、FPN 以及 RetinaNet 等。

0绪论

一般目标检测(generic object detection)的目标是根据大量预定义的类别在自然图像中确定目标实例的位置,这是计算机视觉领域最基本和最有挑战性的问题之一。近些年兴起的深度学习技术是一种可从数据中直接学习特征表示的强大方法,并已经为一般目标检测领域带来了显著的突破性进展。在这个发展迅速的时期,本论文的目标是全面概括近期由深度学习技术为该领域所带来的发展成果。这份综述论文包含超过 250 项关键贡献,覆盖了一般目标检测研究的许多方面:领先的检测框架、基础性的子问题(包括目标特征表示、目标提议生成、形境信息建模和训练策略)、评估问题(尤其是基准数据集、评估指标和当前最佳表现)。最后,我们会指出有研究潜力的未来研究方向。

1 引言

目标检测是计算机视觉领域内一个长期存在的基础性难题,几十年来也一直都是一个活跃的研究领域。目标检测的目标是确定某张给定图像中是否存在给定类别(比如人、车、自行车、狗和猫)的目标实例;如果存在,就返回每个目标实例的空间位置和覆盖范围(比如返回一个边界框 [53, 179])。作为图像理解和计算机视觉的基石,目标检测是解决分割、场景理解、目标追踪、图像描述、事件检测和活动识别等更复杂更高层次的视觉任务的基础。目标检测在人工智能和信息技术的许多领域都有广泛的应用,包括机器人视觉、消费电子产品、安保、自动驾驶、人机交互、基于内容的图像检索、智能视频监控和增强现实。

近来迅猛发展的深度学习技术 [81,116] 是一类能自动从数据中学习特征表示的强大方法。特别需要指出,这些技术已经显著改善了目标检测的表现,这个问题在过去五年中得到了很大的关注,即便之前心理物理学家、神经科学家和工程师已经研究了这个问题数十年时间。

目标检测可以分为两种类型 [69, 240]:特定实例检测和特定类别检测。前者的目标是检测一个特定目标的实例(比如唐纳德·特朗普的脸、五角大楼建筑或我的狗 Penny),而后者的目标则是检测预定义目标类别的不同实例(比如人、车、自行车和狗)。历史上,目标检测领域的很多研究都关注的是单个类别(比如人脸或行人)或少数几个特定类别的检测。而过去几年中,研究界则已经开始向构建通用型目标检测系统的艰难目标迈进,以让目标检测的范围能与人类比肩。

但是在 2012 年,Krizhevsky et al. [109] 提出的深度卷积神经网络(DCNN)AlexNet 在大规模视觉识别挑战赛(ILSRVC)[179] 上实现了创纪录的图像分类准确度。自那以后,许多计算机视觉应用领域都将研究重心放在了深度学习方法上。在一般目标检测领域涌现出了很多基于深度学习的方法 [65, 77, 64, 183, 176],也取得了很大的研究进展,然而我们仍还没有对过去五年一般目标检测主题的全面总结。本论文聚焦于这段快速发展的时间,特别重点关注了基于深度学习的一般目标检测,以呈现出更明晰的一般目标检测全景。

一般目标检测问题本身的定义为:给定任意一张图像,确定其中是否存在任何预定义类别的形义目标实例;如果存在,就返回其空间位置和覆盖范围。目标(object,也可译为「对象」或「物体」)是指可以被看见和触碰的有形事物。尽管一般目标检测和目标类别检测有很多共同的含义,但前者更注重旨在检测种类广泛的自然事物类别的方法,而后者则主要针对特定目标实例或特定类别(比如人脸、行人或车)。一般目标检测已经得到了很大的关注,我们也能从近些年的目标识别竞赛上看出这一点,比如 2006-2012 年的 PASCAL VOC 检测挑战赛 [53, 54],2013 年的 ILSVRC 大规模检测挑战赛 [179] 以及自 2015 年以来的 MS COCO 大规模检测挑战赛 [129]。图 1 展示了近些年目标检测方面的引人注目的进展。

图 1:近些年目标检测表现的发展演进。可以看到,自 2012 年深度学习入场之后,目标检测表现(均值平均精度/mAP)提升显著。最佳检测器的表现每年都有稳定的显著提升。(a)在 PASCAL VOC 数据集上的结果:在 VOC 2007-2012 竞赛中获胜方法的检测结果(仅使用竞赛提供的训练数据)。(b)ILSVRC 2013-2017 中最佳的目标检测竞赛结果(仅使用竞赛提供的训练数据)

2 背景

2.1 问题

一般目标检测(即一般目标类别检测)也被称为目标类别检测 [240] 或目标分类检测,其定义如下。给定一张图像,确定其中是否存在多个预定义类别的任何目标实例;如果存在,就返回每个实例的空间位置和覆盖范围。

图 3:与一般目标检测相关的识别问题。(a)图像层面的目标分类,(b)边界框层面的一般目标检测,(c)像素层面的形义分割,(d)实例层面的形义分割

2.2 主要难题

图 4:一般目标检测中的难题概览

2.3 过去二十年的进展

图 2:目标检测和识别的里程碑,包括特征表示 [37, 42, 79, 109, 114, 139, 140, 166, 191, 194, 200, 213, 215]、检测框架 [56, 65, 183, 209, 213] 和数据集 [53, 129, 179]。在 2012 年之前,主导方法都还是人工设计的特征。我们看到,随着 Krizhevsky et al. [109] 为图像分类开发出了 DCNN,2012 年迎来了转折。这里列出的大多数方法都得到了大量引用并至少赢得了一个 ICCV 或 CVPR 的主要奖项。详见 2.3 节

3 框架

用于识别的目标特征表示和分类器一直以来都在稳步发展,从人工设计特征 [213, 42, 55, 76, 212] 到学习 DCNN 特征的重大变化也证明了这一点 [65, 160, 64, 175, 40]。

相对而言,用于定位的基本「滑动窗口」策略 [42, 56, 55] 仍还是主流,尽管 [113, 209] 也做出了一些努力。但是窗口的数量很大,而且会随像素数量呈二次增长,而且搜索多个尺度和宽高比的需求还会进一步增大搜索空间。巨大的搜索空间会导致高度的计算复杂度。因此,有效且高效的检测框架设计具有关键性作用。经常采用的策略包括级联、共享特征计算和降低每个窗口的计算量。

在这一节,我们会回顾一般目标检测领域在深度学习进入这一领域后出现的里程碑检测框架,如图 6 所示,详细情况总结在表 10 中。过去几年中提出的几乎所有检测器都基于其中一种里程碑检测器,试图在一个或多个方面实现改进。整体而言,这些检测器可以分为两大主要类别:

1. 两级式(two-stage)检测框架,包含一个用于区域提议的预处理步骤,使得整体流程是两级式的。

2. 单级式(one-stage)检测框架,即无区域提议的框架,这是一种单独提出的方法,不会将检测提议分开,使得整个流程是单级式的。

图 6:一般目标检测的里程碑,基于第一个 arXiv 版本的时间点
图 7:里程碑检测框架 RCNN [65, 67] 的细节图示
图 8:用于一般目标检测的领先框架的高层面示意图。表 10 总结了这些方法的特性

4 基础性子问题

这一节将描述重要的子问题,包括特征表示、区域提议、形境信息挖掘和训练策略。每种方法都会通过其主要贡献进行回顾。

4.1 基于 DCNN 的目标表示

作为任何检测器的主要组件之一,优良的特征表示在目标检测中至关重要。

 

表 2:常用于一般目标检测的 DCNN 架构。对于 #Paras 和 #Layers 的统计数据,我们没有考虑最后的 FC 预测层。「Test Error」一列给出了在 ImageNet1000 上的 Top 5 分类测试误差。解释:OverFeat(准确的模型)、DenseNet201(Growth Rate 32, DenseNet-BC)以及 ResNeXt50(32*4d)
图 9:2011-2017 年之间,在 ILSVRC 竞赛的图像分类任务上获胜方法的表现
图 10:HyperNet 和 ION 的比较。LRN 是指局部响应归一化
表 3:在改进用于一般目标检测的 DCNN 特征表示中的表征方法的特性总结。详细讨论参见 4.1.2 节。缩写:Selective Search(SS)、EdgeBoxes(EB)、InceptionResNet(IRN)。mAP@IoU=0.5 时,在 VOC07、VOC12 和 COCO 上报告的检测结果;另一列在 COCO 上的结果是在一个新指标 mAP@IoU=[0.5 : 0.05 : 0.95] 上报告的,这是在从 0.5 到 0.95(写成 [0.5:0.95])的不同 IoU 阈值上平均求取 mAP。训练数据:07 表示 VOC2007 trainval,12 表示 VOC2012 trainval,07+12 表示 VOC07 和 VOC12 trainval 的并集,07++12 表示 VOC07 trainval、VOC07 test 和 VOC12 trainval 的并集,07++12+CO 表示 VOC07 trainval、VOC07 test、VOC12 trainval 和 COCO trainval 的并集。COCO 检测结果是在 COCO2015 Test-Dev 上报告的,只有 MPN [233] 除外,其结果基于 COCO2015 Test-Standard

图 11:Hourglass 架构:Conv1 到 Conv5 是 VGG 和 ResNet 等主干网络中的主要卷积模块。比较而言,近期的方法常会用到一些反向融合模块(RFB)

4.2 形境建模

在物理世界中,视觉目标通常会出现在特定的环境中,并且通常与其它相关目标共同存在,而且有强大的心理学证据 [13, 9] 表明形境在人类目标识别中发挥着关键性的作用。人们也认识到对形境适当建模有助于目标检测和识别 [203, 155, 27, 26, 47, 59],尤其是当目标尺寸过小、存在遮挡或图像质量差等原因造成目标外观特征不充分时。已有研究者探讨了很多不同类型的形境,尤其可参阅 [47, 59]。形境大致可分为这三大类 [13, 59]:

1. 形义形境:目标出现在某些场景而非其它场景中的可能性;

2. 空间形境:在场景中目标与其它物体存在某些位置关系而非其它位置关系的可能性;

3. 尺寸形境:在场景中目标相对其它物体所存在的尺寸限制。

 

表 4:使用了形境信息的检测器汇总,类似表 3
图 13:能探索局部周围形境特征的代表性方法:MRCNN [62]、GBDNet [235, 236]、ACCNN [123] 和 CoupleNet [251],参见表 4

4.3 检测提议方法

检测提议(detection proposal)通常被用作一个预处理步骤,以通过限制需要检测器评估的区域的数量来降低计算的复杂性。因此,一个优良的检测提议应当具备以下特点:

1. 高召回率,只使用少量提议就可以实现;

2. 提议尽可能准确地匹配目标;

3. 高效率。

 


表 5:使用 DCNN 的目标提议方法汇总。蓝色数字表示目标提议的数量。除非另有说明,在 COCO 上的检测结果都使用了 mAP@IoU[0.5, 0.95]
图 14:[175] 中提出的区域提议网络(RPN)图示

4.4 其它特殊问题

表 6:用于训练策略和处理类别不平衡问题的代表性方法。在 COCO 上的结果基于 Test-Dev

 

5 数据集和表现评估


表 7:用于目标识别的常用数据库
 
表 9:用于评估目标检测器的常用指标汇总
 

 

图 17:在 COCO 上的目标检测表现的演进(Test-Dev 上的结果)。这些结果引用自 [64, 80, 176]。在检测中,主干网络、检测器框架的设计和优质的大规模数据集是最重要的三大要素。

6 总结

一般目标检测是计算机视觉领域内一个重要且有挑战性的问题,并且已经得到了相当大的关注。在深度学习技术显著进展的助力下,目标检测领域得到了很大的发展。本论文是对用于一般目标检测的深度学习的全面概述,凸显了近些年取得的成就,并根据这些方法在检测中的作用而提供了一个结构化的分类,汇总了已有的常用数据集和评估指标,并还讨论了大多数代表性方法的表现。

尽管过去几年取得了巨大的成功(比如检测准确度从 ILSVRC2013 的 23% 显著提升至了 ILSVRC2017 的 73%),但当前最佳方法的表现与人类水平仍有巨大差距,尤其是在开放世界学习任务上。还有很多研究工作有待完成,我们可以看到研究者的关注重点主要集中在以下八个领域:

1. 开放世界学习

2. 更好更高效的检测框架

3. 紧凑高效的深度 CNN 特征

4. 稳健的目标表征

5. 形境推理

6. 目标实例分割

7. 弱监督或无监督学习

8. 三维目标检测

 

 

 

 

 

  • 21
    点赞
  • 108
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
1.4Bentley对三维协同设计及BIM的认识 设计的过程是一个从无到有的过程,是人体现智慧和创意的过程。在整个过程中,人始终都是设计的主体,软件系统是帮助人实现设计、表达设计的有效手段。智能化的三维协同设计软件系统的目标不是代替人来完成设计工作,一个优秀的软件系统是最大程度上帮助人去思考,协调参与设计各方紧密工作,利用软件的逻辑分析减少错误,将人从繁琐的重复性劳动中解脱,从而高效的做出更完美的设计。 三维协同设计就是利用数字化的三维协同设计软件系统来进行设计,是设计手段或者设计工具的一种更新。三维设计模式更接近于设计的本质:在真实的三维空间中去表达设计,去推敲设计,去协同工作,以三维的方式去交付我们的设计成果。,同时,在三维设计协同的设计模式下,将更加强调的团队的效率,而不是单个人的效率。 当然,我们也注意到三维协同设计,与传统的二维设计方式并不冲突,对于某些设计,用二维设计方式来表达反而更好,例如:工艺流程设计、电气的控制逻辑设计等等。因此,三维协同设计模式下,我们可以灵活的采用三维或者二维的方式来表达我们的设计。也就是说,在三维的设计模式下,我们采用合适的方式来表达我们的设计。 为了在三维的基础上实现协同,必须在同一个标准下、采用相同的或者兼容的数据格式一起工作,在工作过程中,不同的工作团队需要及时的进行交流。这就需要建立一种机制,保证数据的正确性、唯一性、及时性。这样才能够提高“综合”的效率,而不是单纯某个设计师的“绘图效率”。 在三维协同设计的模式下,我们是在一个三维的空间中进行数字化的协同设计,不仅设计手段发生了变化,设计模式更有效,也为我们提供了更多的方式来表达我们的设计,也提供了更多的“额外”的设计成果:例如,直观的三维碰撞检测、实时的材料报表,以及各种工程模拟。所以,在三维协同设计阶段,我们设计效率更高、设计成果更好、更多,我们的设计也更有价值(如将三维的数字化成果应用于全生命周期管理)。 同时必须注意到的是,三维协同设计模式的实现,除了软件系统提供必不可少的支持以外,还需要相应的、与之匹配的管理模式。所以实现三维协同设计,软件技术+管理模式,二者缺一不可。软件系统提供了必要的平台,管理模式使协同更有效率。 建筑信息模型(BIM)的核心基础就是三维协同设计,事实上,BIM首先就是通过三维设计技术,由不同专业的设计人员协同工作,在计算机中建立一座虚拟建筑物,该建筑物包含所有的设计信息、设计图纸、设计模型等,然后将此虚拟建筑物移交给施工单位进行施工,施工阶段将会有新的信息加入,在建设完成后,整个虚拟建筑物以数字移交的方式交付给业主和运营商,为后续的运营管理提供基础设施完整的数字模型。 三维协同设计是BIM推广应用的基础,因此,选择合适的三维设计平台及专业设计工具,建立可靠的协同工作环境,是成功应用BIM的关键。 1.5Bentley对工程项目全生命周期管理的认识 过去30多年来,基础设施领域不断创造和见证着“中国速度”的奇迹,完成了众多举世瞩目的工程项目,如北京奥运工程、上海世博工程、青藏铁路、京沪高铁、南水北调等。中国勘察设计行业也乘此良机实现了大踏步发展,《工程建设与设计》杂志指出勘察设计行业营业收入2011年达到12914.73亿元,CG/LA Infrastructure调研公司预计,未来20年中国将占据全球基础设施投资的三分之一左右。 进入2013年,基础设施设计与建设单位面临着提升设计与建设业务效率、实现业务转型、推进工程项目智能化、拓展国际市场等挑战,而这些挑战也是新时代赋予基础设施设计与建设单位转型成长的机会。 提升设计与建设业务价值:从速度到效率 正在经受着三边设计频繁、多方参与和项目庞大而建设周期短等因素困扰的中国基础设施设计与建设人员,清楚认识到质量、协同、效率已经成为困扰基础设施设计与建设单位的三大首要挑战。过去,中国基础设施设计与建设单位的发展过多地依赖经济的增长速度,随着经济增长速度的放慢以及新时代的来临,现在需要把推进发展的立足点转移到提高质量和效益上来,实现从速度到效率的转变。 加速设计施工一体化:从基础设施设计与建设单位转型为总承包商 大中型基础设施设计与建设单位专业人士认为总承包及设计施工一体化代表未来趋势,从基础设施设计与建设单位到总承包商的转型已经成为未来发展的共识。基础设施设计与建设单位需要加速设计、建造、运维环节的资源融合,不断推动项目参与各方的协同工作,深化设计能力,并进一步将设计价值最大化。
篇一:《机器人发展现状及未来趋势》 机 人未 展 趋 状 器 发 现 及 来 势 一、 机器人现状及国内外发展趋势 国外机器人领域发展近几年有如下几个趋势: 1.工业机器人性能不断提高(高速度、高精度、高可靠性、便于操作和维修),而单机 价格不断下降,平均单机价格从91年的10.3万美元降至97年的6.5万美元。 2.机械结构向模块化、可重构化发展。例如关节模块中的伺服电机、减速机、检测系统 三位一体化;由关节模块、连杆模块用重组方式构造机器人整机;国外已有模块化装配 机器人产品问市。 3.工业机器人控制系统向基于PC机的开放型控制器方向发展,便于标准化、网络化;器 件集成度提高,控制柜日见小巧,且采用模块化结构;大大提高了系统的可靠性、易操 作性和可维修性。 4.机器人中的传感器作用日益重要,除采用传统的位置、速度、加速度等传感器外,装 配、焊接机器人还应用了视觉、力觉等传感器,而遥控机器人则采用视觉、声觉、力觉 、触觉等多传感器的融合技术来进行环境建模及决策控制;多传感器融合配置技术在产 品化系统中已有成熟应用。 5.虚拟现实技术在机器人中的作用已从仿真、预演发展到用于过程控制,如使遥控机器 人操作者产生置身于远端作业环境中的感觉来操纵机器人。 6.当代遥控机器人系统的发展特点不是追求全自治系统,而是致力于操作者与机器人的 人机交互控制,即遥控加局部自主系统构成完整的监控遥控操作系统,使智能机器人走 出实验室进入实用化阶段。美国发射到火星上的"索杰纳"机器人就是这种系统成功应用 的最著名实例。 7.机器人化机械开始兴起。从94年美国开发出"虚拟轴机床"以来,这种新型装置已成为 国际研究的热点之一探索开拓其实际应用的领域。我国的工业机器人从80年代"七五"科 技攻关开始起步,在国家的支持下,通过"七五"、"八五"科技攻关,目前已基本掌握了 机器人操作机的设计制造技术、控制系统硬件和软件设计技术、运动学和轨迹规划技术 ,生产了部分机器人关键元器件,开发出喷漆、弧焊、点焊、装配、搬运等机器人;其 中有130多台套喷漆机器人在二十余家企业的近30条自动喷漆生产线(站)上获得规模应 用,弧焊机器人已应用在汽车制造厂的焊装线上。但总的来看,我国的工业机器人技术 及其工程应用的水平和国外比还有一定的距离,如:可靠性低于国外产品;机器人应用 工程起步较晚,应用领域窄,生产线系统技术与国外比有差距;在应用规模上,我国已 安装的国产工业机器人约200台,约占全球已安装台数的万分之四。以上原因主要是没有 形成机器人产业,当前我国的机器人生产都是应用户的要求,"一客户,一次重新设计" ,品种规格多、批量小、零部件通用化程度低、供货周期长、成本也不低,而且质量、 可 靠性不稳定。因此迫切需要解决产业化前期的关键技术,对产品进行全面规划,搞好系 列化、通用化、模化设计,积极推进产业化进程。 我国的智能机器人和特种机器人在"863"计划的支持下,也取得了不少成果。其中最为突 出的是水下机器人,6000米水下无缆机器人的成果居世界领先水平,还开发出直接遥控 机器人、双臂协调控制机器人、爬壁机器人、管道机器人等机种;在机器人视觉、力觉 、触觉、声觉等基础技术的开发应用上开展了不少工作,有了一定的发展基础。但是在 多传感器信息融合控制技术、遥控加局部自主系统遥控机器人、智能装配机器人、机器 人化机械等的开发应用方面则刚刚起步,与国外先进水平差距较大,需要在原有成绩的 基础上,有重点地系统攻关,才能形成系统配套可供实用的技术和产品,以期在"十五" 后期立于世界先进行列之中。 二、 发展方向 应从如下几个方面对新一代机器人的技术进行研究。 机器人本体优化设计技术 新一代智能控制机器人技术 关键机器人单元部件制造技术 机器人离线编程和仿真技术 基于外部传感器技术的机器人运动控制 工业机器人产业化制造技术 工业机器人故障远程诊断与修复技术 工业机器人与成套装备协同作业技术 复杂机电系统机构优化设计技术及对系统性能的影响 具有柔性、高度加速,大负载机器人机构动力学建模、模型简化、辨识及控制方法 . 协作机器人:机器人助手和伙伴 机器人控制通常有两种方式,直接遥控和充分自我控制,问题是遥控很麻烦,充分自我 控制往往如科幻电影。可以从中找到一个平衡点,让人类和机器人协作完成任务,比如 下图的PR2机器人递药给人。美国国家机器人倡议(NRL)提供7000万发展协作机器人项目 ,目标是把机器人从工产和实验室扩展到人们的日常生活,就像当年计算机由军用到民 用。这些机器人必须是安全的,价格相对便宜且使用方便,机器人利用其长处配合人类 完成工作。该项目的范围是广泛的,但机器人的一个关键方面是明确的:即与人的互动 。所以希望看到2012协作类机器人有更大发展。 篇二:《机器人发展史
目标检测是计算机视觉领域的重要研究方向之一,其发展历程主要可以分为以下几个阶段: 1. 传统方法阶段:传统方法主要是基于图像处理和机器学习的技术,如卷积神经网络(CNN)、支持向量机(SVM)等。这些方法主要是通过手工设计特征和分类器来进行目标检测,但是在复杂场景下效果不理想。 2. 基于深度学习的方法阶段:随着深度学习技术的发展,基于深度学习的目标检测方法逐渐成为主流。YOLO、Faster R-CNN、SSD等方法的提出,使得目标检测的准确率得到了大幅提升。这些方法主要是通过深度神经网络来进行特征提取和目标检测,可以自动学习到更加丰富的特征,因此在复杂场景下具有更好的鲁棒性。 3. 一阶段和二阶段方法融合阶段:一阶段方法指的是直接从图像中检测目标位置和类别,如YOLO和SSD;而二阶段方法则是先生成候选框,再对候选框进行分类和回归,如Faster R-CNN。近年来,一些研究者尝试将一阶段和二阶段方法进行融合,如RetinaNet和CenterNet等,取得了较好的效果。 4. 目标检测的细分和优化阶段:目标检测领域的发展已经趋于成熟,当前的研究方向主要是在细分和优化方面进行探索。例如,针对小目标检测问题,一些研究者提出了更加高效的算法,如Cascade R-CNN和Libra R-CNN等;针对目标检测的速度和精度之间的平衡问题,一些研究者提出了一些新的算法,如EfficientDet等。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值