CNN - 检测
文章平均质量分 92
cdknight_happy
种一棵树最好的时间是十年前,其次是现在!
展开
-
pyorch代码封装成docker进行模型训练及通过tensorboard查看远程服务器内容器中的训练过程
1 镜像yolov5的训练代码中给出了生成docker镜像的Dockerfile,如下所示:# Start FROM Nvidia PyTorch image https://ngc.nvidia.com/catalog/containers/nvidia:pytorchFROM nvcr.io/nvidia/pytorch:20.10-py3# Install dependenciesRUN pip install --upgrade pip# COPY requirements.txt .原创 2020-11-26 16:03:02 · 1566 阅读 · 0 评论 -
yolov4&v5训练代码理解
1 简介本文依据https://github.com/Tianxiaomo/pytorch-YOLOv4对YoloV4的模型训练和验证代码进行全面解析,理论部分可以参考:Yolo:https://blog.csdn.net/cdknight_happy/article/details/91793142YoloV4:https://blog.csdn.net/cdknight_happy/article/details/107883216GIOU:https://blog.csdn.net/cdkni原创 2020-11-24 08:38:53 · 3543 阅读 · 2 评论 -
CBN:Cross-Iteration Batch Normalization
论文:https://arxiv.org/abs/2002.05712代码:https://github.com/Howal/Cross-iterationBatchNormhttps://github.com/Howal/Cross-iterationBatchNorm/blob/master/mmdet/models/utils/CBN.py1 简介1.1 BNBN(Batch Normalization)在CNN的发展过程中起到了重要的作用,其主要是解决internel covariate原创 2020-08-14 18:54:11 · 440 阅读 · 0 评论 -
Yolov4
论文:https://arxiv.org/abs/2004.10934代码:https://github.com/AlexeyAB/darknet1 简介YoloV4的主要贡献有:实现了高效准确的目标检测,可以在单块1080Ti或2080Ti显卡上完成高效准确的目标检测器的训练;验证了目标检测模型训练过程中诸多trick的有效性;修改了当前模型,使其更加适合于在单显卡上进行训练且训练效果更高。2 相关工作2.1 目标检测模型当前的目标检测器一般由两个组件组成,一是在ImageNet上原创 2020-08-11 17:42:34 · 729 阅读 · 0 评论 -
EfficientDet
论文:https://arxiv.org/pdf/1911.09070.pdf代码:https://github.com/google/automl/tree/master/efficientdet1 问题提出近年来的目标检测算法取得了很大的进步,但往往算法计算量很大,无法在机器人及自动驾驶领域应用。而单阶段、anchor free的算法和模型压缩又会损失检测精度。因此,作者提出能否针对不同的应用场景,构建可伸缩的检测架构以实现高效准确的目标检测?作者研究了一阶段目标检测算法的骨干网络设计、特征融合原创 2020-08-08 15:45:45 · 391 阅读 · 0 评论 -
GIOU、DIOU、CIOU
1 GIOU论文:https://arxiv.org/abs/1902.09630代码:https://github.com/generalized-iou/g-darknet1.1 摘要IOU是目标检测中的度量标准,但进行目标位置回归时一般使用的是L1L_1L1或L2L_2L2损失,作者证明了最小化这些损失并不等同于可以最大化IOU。因此,作者认为应该将最终的优化目标作为损失函数。但是普通的IOU在两个目标框不重叠时值为0,如果以它为损失函数此时反传的梯度为0,无法进行模型的训练。所以作者提出原创 2020-08-07 20:11:48 · 2119 阅读 · 0 评论 -
IOU-Net
论文:Acquisition of Localization Confidence for Accurate Object Detectionhttps://arxiv.org/abs/1807.11590代码:https://github.com/vacancy/PreciseRoIPooling1 问题提出目标检测一般分为两个过程,一是对proposal进行分类获取目标的类别信息,二是对proposal进行回归以得到目标的位置信息,最后对获取的检测结果根据IOU进行NMS处理得到最终的检测结果。原创 2020-06-03 10:02:12 · 332 阅读 · 0 评论 -
nms、softnms、softernms
softnms:https://arxiv.org/abs/1704.04503softernms:1 NMS目标检测的pipeline中,通过神经网络的处理,输出了一系列的预测框,为了保证检测的召回率,这些预测框一般都相互重叠(多个检测框对应同一个目标)。为了提升检测效果,一般会使用置信度过滤+NMS进行检测结果的后处理。置信度过滤即人为设定置信度阈值,只保留超过阈值的检测框。NMS用于消除同一目标上的多个重复框,一般是针对各类目标单独应用NMS,NMS的实现思路为:设定两个数据集,B表示所原创 2020-05-21 17:55:52 · 1288 阅读 · 0 评论 -
RFBNet
论文:https://arxiv.org/abs/1711.07767代码:https://github.com/ruinmessi/RFBNet1 当前的目标检测及存在的问题自从RCNN开创了使用CNN进行目标检测的先河之后,一系列的基于CNN的目标检测算法不断演化取得了越来越好的检测效果。主流的检测算法分为两类,一类是两阶段的检测算法,另一类是一阶段的检测算法。两阶段的检测算法包括RCN...原创 2020-05-08 14:03:28 · 638 阅读 · 0 评论 -
Deformable Convolutional Networks
论文:http://xxx.itp.ac.cn/abs/1703.062111 简介计算机视觉中的一个关键挑战是如何适应目标的几何变换,如尺度、姿态、视角和部分形变。一般来说,有两种解决方法,第一个是构建包含了想学习的形变的足够大的训练数据集,这样的数据集可以通过对现有数据集进行增广(如进行仿射变换)得到,从包含了形变的数据集中可以学习到鲁棒的特征表示,但是代价是大量的训练数据和复杂的模型结构...原创 2020-04-27 16:54:53 · 359 阅读 · 0 评论 -
DetNet
文章:https://arxiv.org/abs/1804.06215原创 2020-01-31 19:12:49 · 326 阅读 · 0 评论 -
Group Normalization
论文:https://arxiv.org/abs/1803.08494原创 2020-01-29 21:13:05 · 341 阅读 · 0 评论 -
smoothL1理解
之前再看Fast R-CNN的时候,网络bounding boxes回归使用的smooth L1 loss,当时并没有去细想为什么用这个loss而不是l2 loss,这个loss有什么好?直到昨天看别的论文的时候提到smooth L1具有更强的鲁棒性,为什么smooth L1 loss具有更好的鲁棒性呢?上网查了下,下面是知乎的一个回答,感觉非常通俗易懂,所以就转了过来,原文——请问faster ...转载 2019-12-05 11:04:09 · 873 阅读 · 1 评论 -
Single-Shot Refinement Neural Network for Object Detection
文章:https://arxiv.org/abs/1711.06897代码: https://github.com/sfzhang15/RefineDet0 摘要对于目标检测,两阶段的方法(如Faster R-CNN)取得了最高的准确率,一阶段方法(如SSD)效率高。为了在克服各自缺点的同时保持各自的优点,本文提出了新的叫做RefineDet的目标检测算法,该算法在比两阶段检测算法准确率更高...原创 2019-09-12 17:18:45 · 195 阅读 · 0 评论 -
Focal Loss for Dense Object Detection
文章地址:https://arxiv.org/abs/1708.02002代码: https://github.com/facebookresearch/Detectron0 摘要迄今为止最高精度的目标检测器基于由R-CNN推广的两阶段方法,将分类器应用于稀疏的候选目标位置集。相比之下,在可能的位置进行规则、密集采样的单阶段检测器具有更快和更简单的可能性,但迄今为止其精度落后于两阶段检测器的...原创 2019-09-07 20:08:38 · 281 阅读 · 0 评论 -
R-CNN
0 摘要RCNN在PASCAL VOC 2012检测集上mAP达到了53.3%;两个重要的结论:CNN可以用来实现检测和分割任务中的目标定位;训练集不足时,使用预训练模型进行微调可以获取良好的应用效果。1 简介目标检测任务在2010 - 2012年期间进展很少,自从2012年AlexNet在ILSVRC成功以来,大家都在讨论一个问题:CNN对ImageNet的分类结果可以在多大程度...原创 2019-01-19 17:34:37 · 179 阅读 · 0 评论 -
OverFeat
1 计算机视觉任务分类:给定一张输入图像,图像分类任务旨在判断该图像所属类别;定位:在图像分类的基础上,我们还想知道图像中的目标具体在图像的什么位置,通常是以包围盒的(bounding box)形式;分类和检测任务中往往目标数量较少,且目标占据图像的核心位置;检测:在目标定位中,通常只有一个或固定数目的目标,而目标检测更一般化,其图像中出现的目标种类和数目都不定,甚至根本不包含目标,且检测...原创 2019-01-20 22:13:41 · 536 阅读 · 0 评论 -
SPP-Net
论文:Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition1 摘要现有的深度卷积神经网络(CNN)需要固定大小(例如,224×224)的输入图像。这种要求是“人为的”并且可能降低任意尺寸/比例的图像或子图像的识别精度。在本文中,我们为网络配备了更具原则性的池化策略,即“空间金字塔池化”,以消除...原创 2019-02-25 12:00:38 · 1201 阅读 · 0 评论 -
Fast R-CNN
1 摘要本文提出了一种快速的基于区域的卷积网络方法(Fast R-CNN)用于物体检测。快速R-CNN建立在先前的工作基础上,以使用深度卷积网络有效地对建议对象区域进行分类。与之前的工作相比,Fast R-CNN采用了多种创新技术来提高训练和测试速度,同时提高了检测精度。快速R-CNN训练非常深的VGG16网络比R-CNN快9倍,测试时间快213倍,并在PASCAL VOC 2012上实现更高的...原创 2019-04-14 17:36:49 · 1031 阅读 · 0 评论 -
Faster R-CNN
文章:https://arxiv.org/abs/1506.014970 摘要现在最先进的目标检测网络依赖于区域提议算法来假设目标位置。像SPPnet [1]和Fast R-CNN [2]这样最新的算法减少了检测网络的运行时间,使区域提议计算成为了瓶颈。在本文中,我们引入了一个区域提议网络(RPN),它与检测网络共享全图像卷积特征,从而实现了几乎无成本的区域提议。RPN是一个全卷积网络,可同时...原创 2019-05-05 10:13:53 · 832 阅读 · 0 评论 -
Yolo
YoloV1:https://arxiv.org/abs/1506.02640YoloV2:https://arxiv.org/abs/1612.08242YoloV3:https://arxiv.org/abs/1804.02767官网:https://pjreddie.com/darknet/yolov2/https://pjreddie.com/darknet/yolo/Yolo...原创 2019-06-14 17:29:56 · 2582 阅读 · 0 评论 -
Real-Time Brazilian License Plate Detection and Recognition Using Deep Convolutional Neural Networks
文章:Real-Time Brazilian License Plate Detection and Recognition Using Deep Convolutional Neural Networkshttp://sergiomsilva.com/pubs/real-time-brazilian-alpr/0 摘要自动车牌识别(ALPR)是智能交通和监控系统中有许多应用的重要任务。与其...原创 2019-06-25 15:55:17 · 1297 阅读 · 0 评论 -
License Plate Detection and Recognition in Unconstrained Scenarios
论文:License Plate Detection and Recognition in Unconstrained Scenarioshttps://www.researchgate.net/publication/328109840_License_Plate_Detection_and_Recognition_in_Unconstrained_Scenarios_15th_Europea...原创 2019-06-24 13:47:52 · 4096 阅读 · 7 评论 -
SSD:Single Shot MultiBox Detector
论文:https://arxiv.org/abs/1512.023250 摘要我们提出了一种使用单个深度神经网络进行图像中目标检测的方法。我们的方法名为SSD,将边界框的输出空间离散化为一组默认框,在每个特征图位置上获得了多种宽高比、尺度的检测框。在预测时,网络为每个默认框中的每个对象类别的存在可能性进行评分,并对检测框进行调整以更好地匹配目标形状。另外,网络将来自具有不同分辨率的多个特征图的...原创 2019-08-30 17:01:40 · 382 阅读 · 0 评论 -
图像处理中的hard negative mining(难例挖掘)
转载自:https://blog.csdn.net/qq_36570733/article/details/83444245本篇总结了一下知乎上的回答,原文链接:https://www.zhihu.com/question/46292829在目标检测中我们会事先标记好ground_truth,接下来在图片中随机提取一系列sample,与ground_truth重叠率IoU超过一定阈值的(比如0...转载 2019-09-02 10:47:46 · 491 阅读 · 0 评论 -
OHEM:Training Region-based Object Detectors with Online Hard Example Mining
文章地址:https://arxiv.org/abs/1604.035400 摘要目标检测领域在基于区域的ConvNets的浪潮中取得了重大进展,但是他们的训练过程仍然包括很多启发式和超参数,调整成本很高。我们提出了一种简单但令人惊讶的有效在线难例挖掘(OHEM)算法,用于训练基于区域的ConvNet检测器。我们的动机与以往一样 - 检测数据集包含大量简单示例和少量难例。自动选择这些难例可以使...原创 2019-09-02 16:06:38 · 352 阅读 · 0 评论 -
R-FCN:Object Detection via Region-based Fully Convolutional Networks
文章地址:https://arxiv.org/pdf/1605.06409.pdf0 摘要我们提出基于区域的、全卷积网络,实现准确高效的目标检测。与先前基于区域的检测器(例如Fast/Faster R-CNN [6,18])相比,我们基于区域的检测器完全卷积,几乎所有计算都在整个图像上共享。为了实现这一目标,我们提出了位置敏感的得分图,以解决图像分类中的平移不变性和目标检测中的平移变化之间的两...原创 2019-09-03 21:16:01 · 303 阅读 · 0 评论 -
FPN:Feature Pyramid Networks for Object Detection
文章地址:https://arxiv.org/abs/1612.031440 摘要特征金字塔是目标识别系统能够进行多尺度目标识别的关键组件。但由于特征金字塔的内存占用和计算量很大,因此很多算法都不想使用它。本文利用深度卷积网络本身固有的多尺度、层次化构建特征金字塔,只带来了很少的额外成本。本文开发了具有横向结构的从上到下的连接,用于在所有尺度上构建高层语义特征。本文提出的网络叫做FPN,在很多...原创 2019-09-04 18:46:42 · 382 阅读 · 0 评论 -
深度学习-目标检测评估指标P-R曲线、AP、mAP
转载自:https://blog.csdn.net/qq_41994006/article/details/81051150 基本概念P-R曲线中,P为图中precision,即精准度,R为图中recall,即召回率。Example下面通过具体例子说明。首先用训练好的模型得到所有测试样本的confidence score,每一类(如car...转载 2019-01-19 15:41:45 · 3074 阅读 · 1 评论