目标检测
文章平均质量分 92
目标检测
时光机゚
为了我的名字~。~
展开
-
【论文阅读笔记】YOLOv10: Real-Time End-to-End Object Detection
YOLO系列的前作基本都含有网络的前馈部分以及NMS后处理部分。使用NMS的原因是因为o2m的标签分配策略(单个GT框对应多个正样本训练,也是平衡正负样本的一种方式)会导致预测时产生密集正样本,需要在最后选出最佳预测。此外,NMS对参数敏感,也让YOLO无法实现最佳端到端部署。摆脱NMS的限制采用端到端的DETR架构。采用混合模型将DETR推向实时应用领域,如RT-DETR。此种方法复杂度高;探索端到端的CNN-based检测器,使用one-to-one的标签分配方式。原创 2024-09-19 16:49:34 · 702 阅读 · 0 评论 -
目标检测综述
R-CNN 用Selective Search的方法获取一些可能的候选框,将这些候选框送进CNN中进行特征提取(作者尝试了卷积层或两个全连接层作为提取的特征,最后发现最后一层全连接层用于分类的效果更好),将提取到的特征放入SVM分类器和回归器,进行class-else多分类和边框回归(对每一个类别进行一次SVM分类)。边框回归:(其中{Px,Py,Pw,Ph}{Px,Py,Pw,Ph}...原创 2018-09-04 04:01:03 · 812 阅读 · 0 评论 -
【论文阅读笔记】DSSD:Deconvolutionl Single Shot Detector
论文地址:DSSD:Deconvolutionl Single Shot Detector论文时间:2017.01发布,无修改全文概括 DSSD 相对于 SSD 增加部件的思路和 FPN 相似,都是增加一个 top-down 路径,同时增加一个 skip-connection 横向连接。在预测时,DSSD 研究了几个 预测模块 (PM,Prediction Module) ,发现在输出...原创 2019-03-05 20:54:19 · 497 阅读 · 0 评论 -
【论文阅读笔记】CSPNet:A New Backbone that can Enhance Learning Capability of CNN
论文地址:https://arxiv.org/abs/1911.11929代码地址:https://github.com/WongKinYiu/CrossStagePartialNetworks.论文总结 本文的目的旨在优化之前含有ShortCut结构的网络,比如DenseNet和ResNet。其围绕的中心思想是网络优化中的重复梯度信息,以此来优化之前网络中所需要的大量推理计算问题。最后,优化的网络结构在ImageNet和MS COCO上都有好的结果。因此可以初步认为具有足够的泛化能力。论文介绍原创 2021-03-05 17:57:21 · 4499 阅读 · 1 评论 -
【论文阅读笔记】Learning Data Augmentation Strategies for Object Detection
论文地址:https://arxiv.org/abs/1906.11172论文总结 本文是19年关于目标检测数据增强的论文,也没有提出啥开创性思想,主要思想就是“目标检测的数据增强应该和分类不一样,要有一些不同的数据增强策略”,然后做了一些实验来验证数据增强的组合。 然后通过搜索,得到了几组数据增强策略。还有就是,可以在小数据集上进行策略的应用,该策略在大数据集上也能有足够的泛化效应。 作者的贡献主要在搜索方法上,通过强化学习等工具,离散优化搜索策略空间。 学习到的5个子策略,如下图所示:原创 2021-02-04 20:20:50 · 454 阅读 · 1 评论 -
【论文阅读笔记】Yolov4:Optimal Speed and Accuracy of Object Detection
论文地址:YOLOv4论文总结 yolov4并没提出什么创新性的东西,论文中更多的是将当前目标检测各方向的方法进行了个汇合,比如数据增强、网络结构等。经过试验后,作者选出一组其认为适用的方法组合,通过结合各种tricks得到的特征得到一个好结果。其目标是一个能较高效率应用于GPU上的网络,而不是一些参数,比如BFLOPs。方法介绍Bag of freebies Bag of freebies(Bof),表示的是那些只通过改变训练策略或只增加训练成本的方法,即不添加推理时间。目标检测原创 2020-07-16 23:48:40 · 872 阅读 · 1 评论 -
【论文阅读笔记】EfficientDet:Scalable and Efficient Object Detection
论文地址:EfficientDet论文总结 本文是基于EfficientNet展开的检测网络,其提出了一种新的特征融合手段(BiFPN),以及检测器上的缩放方案(如EfficientNet一样的多维度组合缩放方案),可以得到一个高效率又高性能的网络。 BiFPN通过对FPN添加一个bottom-up的路径以及做了一些修改,之后又对每一个特征融合的特征添加了权重的影响,这与传统的相同大小feature map直接相加不同。 网络性能展示如下:论文介绍 BiFPN是一个有效的双向的同尺原创 2020-07-08 22:48:36 · 1014 阅读 · 0 评论 -
【论文阅读笔记】CenterNet:Objects as Points
全文概括 CenterNet是一个anchor-free的检测器。其将每一个对象用一个中心点(keypoint)表示,其余的属性,比如边框大小之类的,都由该中心点所在的 keypoint feature 所回归出来。 CenterNet是通过heatmap提取峰值得到的边框位置信息,不需要经过NMS操作,这能省去相当一部分的运行时间。 CenterNet输出分辨率的下采样因子strid...原创 2020-03-09 19:11:37 · 643 阅读 · 0 评论 -
【论文阅读笔记】ThunderNet: Towards Real-time Generic Object Detection
全文总结 ThunderNet 是一个 two-stage 的目标检测网络,其运行计算量比 one-stage 检测网络要小,性能比 one-stage 检测网络要好。 ThunderNet 的主要创新点在于 RPN 的应用上。在RPN网络应用时,ThunderNetr 提出两个模块:CEM(Context Enhancement Module)和 SAE(Spatial Attent...原创 2020-02-28 23:14:05 · 463 阅读 · 0 评论 -
【论文阅读笔记】Single-Shot Refinement Neural Netwok for Object Detection
论文地址:Single-Shot Refinement Neural Netwok for Object Detection论文时间:2017.11发布,2018.01最终能修改全文概括 本文发表于DSSD之后,其基本框架结构形状与DSSD大概一致(上采样手段也使用的是转置卷积 deconvolution)。不同的地方在于,其(1) 在骨干网络的特征提取过程中,增加了一个RPN(Fast...原创 2019-03-02 23:18:29 · 300 阅读 · 0 评论 -
【论文阅读笔记】Feature Pyramid Networks for Object Detection
地址:Feature Pyramid Networks for Object Detection时间:2016.12第一次发布,2017.03最终修改全文概括 本文就是提出了一种架构的思路,即 top-down路径与 横向连接(U-Net那种反卷积的高级语义特征与相对应尺寸的 down-top 低级语义特征的叠加)的结构,这是为了解决目标检测中小物体难以检测的问题。结构介绍 上...原创 2019-02-17 23:29:18 · 217 阅读 · 0 评论 -
【论文阅读笔记】SSD:Single Shot MultiBox Detector
地址:SSD:Single Shot MultiBox Detector时间:2015年12月发布,2016年12月最终全文概括 SSD引入了Faster RCNN的anchor,使用多level 的 feature map来进行分类和回归,从而增强多尺度的语义信息(SSD应用在不同尺度的feature 上)。 在VOC 2007 test数据集上,SSD达到74.3%74.3\%...原创 2019-02-22 21:41:58 · 275 阅读 · 0 评论 -
【论文阅读笔记】You Only Look Once: Unified,Real-Time Object Dection
论文链接:https://arxiv.org/abs/1506.02640 作者:Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi 发布时间:2015年1月发布,2016年5月月最后修改 概要 相比较传统方法将目标检测定位为分类问题,YoLo算法将目标检测算法当做空间独立的bounding-boxes的回归问题...原创 2018-07-23 21:36:35 · 529 阅读 · 0 评论 -
【论文阅读笔记】Rich feature hierarchies for accurate object detection and semantic segmentation
发布时间:2014年 论文链接:https://arxiv.org/abs/1311.2524 源码:https://github.com/rbgirshick/rcnn前言 该论文是R-CNN系列的第一篇,其截取的区域图片(rigion proposals)大小不一,所以需要缩放到统一大小。后面借鉴SPP-NET提取特征的方式,可以处理不同大小的输入。该方法与用卷积运算代替全连接运...原创 2018-07-12 15:28:39 · 806 阅读 · 0 评论 -
【论文阅读笔记】Fast R-CNN
概要 论文的CNN实验架构从 AlexNet 到 VGG16AlexNet 到 VGG16AlexNet\ 到\ VGG16。该论文的架构的训练速度、测试速度、精确度比 RCNN 和SPPnetRCNN&am原创 2018-07-14 11:52:14 · 419 阅读 · 0 评论 -
【论文阅读笔记】Faster R-CNN:Towards Real-Time Object Detection with Region Proposal Networks
论文链接:https://arxiv.org/abs/1506.01497 作者:Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun 发布时间:2015年 摘要 之前最先进的目标检测模型如Fast RCNN和SPPnet都受限于候选区域的计算,导致不能实现实时监测。在本论文中,作者引入了Region Proposal Netw...原创 2018-07-15 15:33:35 · 1923 阅读 · 0 评论 -
【论文阅读笔记】YOLO9000:Better,Faster,Stronger
前言 该文是YOLO系列第二篇,在模型结构上做的改变主要是添加了anchores(就如同Faster RCNN中的anchores一样,但选择方式不同,Faster RCNN是通过直接设定尺度及长宽比的形式,而YOLOv2通过);以及考虑了Fine-Grained Features问题,添加了一个passthrough,将不同resolution的特征结合在了一起;剩下的篇幅讲的是训练技巧、...原创 2018-07-30 13:07:40 · 367 阅读 · 1 评论 -
目标检测前提知识
mAP mAP,Mean Average Precision,平均精度,用于评估预测的定位和分类的算法,其对于评估定位模型、目标检测模型和分割模型是有效的。【因为用于分类的precision不能直接用于具有定位问题的模型,所以引入mAP概念】 Ground Truth 对于一个评估算法,其测量标准就是和ground truth的比较(Training,Validation,T...翻译 2018-07-27 16:38:48 · 1178 阅读 · 1 评论 -
【论文阅读笔记】YOLOv3: An Incremental Improvement
论文链接:https://arxiv.org/abs/1804.02767 作者:Joseph Redmon, Ali Farhadi 发布时间:2018年4月8日发布 摘要 作者对YOLO进行了进一步更新,做了些小设计使其更好。YOLOv3比YOLOv2较大,但准确率更高。 引言 该文会先展示YOLOv3的详细内容,然后告诉读者是怎么做的。再然后展示作者所尝试过却没效...原创 2018-08-04 22:23:16 · 403 阅读 · 1 评论 -
【论文阅读笔记】Focal Loss for Dense Object Detection
第一次发布时间:2017.08第二次发布时间:2018.02论文地址:Focal Loss for Dense Object Detection全文概括 该论文首先总结了目标检测的两个主要方向:1) two-stage 区域候选型检测器;2) one-stage 密集采样每一个可能的位置。Two-stage 分为两段,第一段专注于 proposals 的提取,第二段专注于对第一段提取出的...原创 2019-01-25 11:17:49 · 277 阅读 · 0 评论 -
【论文阅读笔记】Deep Neural Networks for Object Detection
论文背景 该论文发布于2013年,此时DNNDNNDNN在图像分类任务上表现很好,但未曾在目标检测上有建树。在这论文之前的目标检测多用DPM(Deformable Part-base Model,基于部件的可变形模型),DPM模型是基于精心设计的表示以及基于流体的对象分解的图模型,利用判别图模型去构建检测的对象。该文章提出了一种基于多尺度推断的网络实现目标检测,但后面一些解决某些问题的方案,...原创 2018-07-11 20:04:07 · 1551 阅读 · 2 评论