![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
对象检测
文章平均质量分 82
Fm镄
这个作者很懒,什么都没留下…
展开
-
【好文转载】谈谈CNN中位置和尺度问题
前言前段时间看到了几篇有意思的文章,也参考了一些相关的讨论,这里想对CNN中的平移和尺度的不变性和相等性,以及CNN对于目标相对和绝对位置、深度的预测原理进行探讨。这些内容对于一些特定任务很重要,比如目标检测、目标分割、深度估计、分类/识别以及单目标跟踪中的置信图预测等。1 CNN是否存在平移和尺度的不变性和相等性1.1 不变性和相等性的定义在介绍卷积神经网络(CNN)之前,我们对于不变性和相等性的理解可能来自于传统图像处理算法中的,平移、旋转、光照和尺度等不变性,比如HOG梯度方向直方图,转载 2021-12-14 10:19:03 · 427 阅读 · 0 评论 -
目标检测候选框的生成:选择性搜索
转载自:https://blog.csdn.net/u010402786/article/details/78051647滑动窗口算法/Sliding Window Algorithm 在滑动窗口方法中,我们在图像上滑动一个框或窗口来选择一个区域,并使用目标识别模型对窗口覆盖的每个图像块进行分类。这是一个穷尽搜索整个图像的对象。我们不仅需要搜索图像中所有可能的位置,还得在不同的尺度上搜...转载 2019-11-03 17:55:13 · 3418 阅读 · 1 评论 -
Faster RCNN系列算法演变历程(一)
前言RCNN--->SPPNet--->Fast-RCNN---->Faster-RCNNFaster RCNN是two stage算法的代表之一,在Faster RCNN提出前作者依次提出了RCNN,Fast RCNN这样一系列的深度学习的目标检测算法,这一过程也是作者对深度学习目标检测算法的不断完善,一直到Faster RCNN才完整的设计出了一个从图像端到检测目标的...原创 2019-11-01 22:08:16 · 1170 阅读 · 0 评论 -
SSD系列算法的优化和扩展笔记
DSSDSSD算法对小目标不够鲁棒的最主要的原因是浅层feature map的表征能力不够强。由此进行以下的改进:加入上下文信息 更好的基础网络(ResNet)和Deconvolution层,skip连接来给浅层feature map更好的表征能力DSOD:在改进深度学习目标检测算法模型时,通常会强调不同组件的优化和改进。对于很多算法都会在训练时都会采用预训练模型作为初始化。而...原创 2019-10-29 20:51:37 · 602 阅读 · 0 评论 -
NMS及变体简述
NMS(非极大值抑制算法)目的:为了消除多余的框,找到最佳的物体检测的位置思想:选区那些邻域里分数最高的窗口,同时抑制那些分数低的窗口具体流程:首先对所有检测框按照得分排序(得分就是分类器得到的概率值),选出得分最高的检测框。删除掉和选取得最大得分框IOU超过设定阈值的其他框;对剩下的没有处理的检测框进行同样的操作;当所有框都被处理后输出最终结果。Soft-NMS一个改进算...原创 2019-10-28 16:27:01 · 2475 阅读 · 0 评论 -
HOG+SVM传统行人检测方法概述
HOG+SVM主要用于行人检测行人检测得难点在于行人目标处于运动状态,姿态存在非常多得差异。主要流程如下:1.提取HOG特征2.训练SVM分类器3.利用滑动窗口提取目标区域,进行分类判断4.NMS5.输出检测结果HOG特征(纹理特征的一种)具体可以参考这篇博客,写的很好:https://blog.csdn.net/Pierce_KK/article/details/...原创 2019-10-28 09:56:36 · 1468 阅读 · 0 评论 -
one-stage检测算法负样本淹没问题
1.什么是“类别不平衡”呢?详细来说,检测算法在早期会生成一大波的bbox。而一幅常规的图片中,顶多就那么几个object。这意味着,绝大多数的bbox属于background。2.“类别不平衡”又如何会导致检测精度低呢?因为bbox数量爆炸。正是因为bbox中属于background的bbox太多了,所以如果分类器无脑地把所有bbox统一归类为background,accurac...转载 2019-06-22 10:22:27 · 191 阅读 · 0 评论 -
two-stage目标检测算法介绍
综述two-stage是基本深度学习的目标检测算法的一种。主要通过一个完整的卷积神经网络来完成目标检测过程,所以会用到的是CNN特征,通过卷积神经网络提取对候选区域目标的特征的描述。典型的代表:R-CNN到faster RCNN。如果不考虑two-stage方法需要单独训练RPN网络这一过程,可以简单的广义的理解为端到端的过程。但不是完全的端到端,因为训练的整个网络过程中需要两个步骤:1.训练...原创 2019-06-18 21:01:44 · 12402 阅读 · 0 评论 -
传统目标检测算法基本流程
传统目标检测算法基本流程首先给定一张待检测图片,然后对这张图片进行候选框的提取。候选框的提取通常采用滑动窗口的方法进行,接下来对每个窗口中的局部信息进行特征提取(通常采用一些经典的计算机视觉模式识别中的算法,包括:基于颜色、基于纹理、基于形状的方法,以及一些中层次或高层次语义特征的方法,这些方法有些是需要学习得到的。如:抽取基本的直方图特征,常见的纹理特征)计算机视觉中常见的特征提...原创 2019-06-27 18:49:13 · 15919 阅读 · 0 评论 -
SSD系列算法原理
·主干网络:VGGNet·多尺度FeatureMap预测·Defaul bounding boxes的类别分数、偏移量主干网络介绍:VGG、ResNet、MobileNets等,各种卷积神经网络 将VGG最后两个FC改成卷积,并增加4个卷积层:(因为原始的网络是处理分类任务,而目标检测不需要)多尺度FeatureMap预测:不同层的feature map Prior ...原创 2019-10-29 15:42:54 · 302 阅读 · 0 评论 -
Video Object Detection with an Aligned Spatial-Temproal Memory论文解读(STMN)
论文下载地址:http://fanyix.cs.ucdavis.edu/project/stmn/project.html官方源码地址:https://github.com/fanyix/STMNAbstract简单的总结一下,本文针对视频目标检测问题提出时空记忆网络(STMN)主要贡献如下:1.STMM(时空记忆模块):用于提取视频中时序信息的RNN模型的核心模块2.Ma...原创 2019-08-20 11:08:44 · 740 阅读 · 0 评论 -
one stage 与 two stage 对比
One stage VS Two stageone stage:优点速度快 避免背景错误,产生false positives,也就是说误检率很低 能够学到物体的泛化特征缺点精度低(定位、检出率) 小物体的检测效果不好two stage:优点精度高(定位、检出率) Anchor机制 共享计算量缺点速度慢 训练时间长 误报高...原创 2019-07-01 18:34:15 · 1911 阅读 · 1 评论 -
one stage目标检测算法介绍
使用CNN卷积特征,进行特征抽取。直接回归物体的类别概率和位置坐标(无RPN网络)准确度低/速度相对two stage快one stage 基本流程one stage 目标检测算法在给定输入后,会通过一个主干网络完成特征的抽取,然后会直接进行区域的回归以及目标的分类。相对于two stage最大的区别就是是否包含了候选区域推荐的过程,流程上更加简单,速度更快。One sta...原创 2019-06-22 10:11:58 · 2089 阅读 · 0 评论 -
BoundingBox边框回归
//转载//Bounding-Box regression最近一直看检测有关的Paper, 从rcnn, fast rcnn, faster rcnn, yolo, r-fcn, ssd,到今年cvpr最新的yolo9000。这些paper中损失函数都包含了边框回归,除了rcnn详细介绍了,其他的paper都是一笔带过,或者直接引用rcnn就把损失函数写出来了。前三条网上解释比较多,后面的两...转载 2018-12-18 16:18:38 · 220 阅读 · 0 评论 -
为什么CNN可以自动提取图像特征???
转载自:http://www.algorithmdog.com/cnn-extracts-feat?hmsr=toutiao.io&utm_medium=toutiao.io&utm_source=toutiao.io1.介绍在大部分传统机器学习场景里,我们先经过特征工程等方法得到特征表示,然后选用一个机器学习算法进行训练。在训练过程中,表示事物的特征是固...转载 2019-04-01 10:48:19 · 2314 阅读 · 0 评论 -
为什么CNN可以自动提取图像特征???(2)
作者:electech6来源:CSDN原文:https://blog.csdn.net/electech6/article/details/845847911.卷积操作假设有一个55的图像,使用一个33的卷积核(filter)进行卷积,得到一个3*3的矩阵(其实是Feature Map,后面会讲),如下所示:下面的动图清楚地展示了如何进行卷积操作(其实就是简单的点...转载 2019-04-01 10:52:33 · 1784 阅读 · 2 评论 -
RoI Pooling详解
目标检测architecture通常可以分为两个阶段:(1)region proposal:给定一张输入image找出objects可能存在的所有位置。这一阶段的输出应该是一系列object可能位置的bounding box。这些通常称之为region proposals或者 regions of interest(ROI),在这一过程中用到的方法是基于滑窗的方式和selective sear...转载 2019-04-11 09:23:15 · 7485 阅读 · 3 评论 -
ROI Pooling代码原理详细解释和存在目的
ROIs Pooling顾名思义,是pooling层的一种,而且是针对ROIs的pooling;整个 ROI 的过程,就是将这些 proposal 抠出来的过程,得到大小统一的 feature map。什么是ROI呢?ROI是Region of interest的简写,指的是faster rcnn结构中,经过rpn层后,产生的proposal对应的box框。所以ROI就是指矩形框,往...转载 2019-04-11 10:09:27 · 1510 阅读 · 2 评论 -
Deformable Convolutional Networks 可变形卷积
AbstractConvolutional neural networks (CNNs) are inherently limited to model geometric transformations due to the fixed geometric structures in their building modules. 卷积神经网络由于它内部固定的几何结构,所以对模型的几何变...原创 2019-04-11 19:46:40 · 330 阅读 · 0 评论 -
Deformable Convolutional Networks v2 可变形卷积v2论文理解(更新中)
本论文的翻译版可以参考我的这篇博客:https://blog.csdn.net/weixin_39568744/article/details/89218635知识栈在阅读这篇论文时遇到了很多知识盲区和疑惑,所以途中阅读了很多其他论文和文章。现将其中感觉不错的记录如下:知识蒸馏网络:https://www.cnblogs.com/liaohuiqiang/p/9170582.html...原创 2019-04-15 20:36:02 · 2257 阅读 · 0 评论 -
Deformable Convolutional Networks v2 可变形卷积v2版翻译
AbstractThe superior performance of Deformable Convolutional Networks arises from its ability to adapt to the geometric variations of objects.可变形卷积网络的优越性能源于其对目标几何变化的适应能力Through an examination of...原创 2019-04-12 21:58:21 · 3635 阅读 · 0 评论 -
Spatial Transformer Networks(空间变换网络)论文解读
转载自:https://www.cnblogs.com/liaohuiqiang/p/9226335.html论文来源:2015, NIPSMax Jaderberg, Karen Simonyan, Andrew Zisserman, Koray KavukcuogluGoogle DeepMind为什么提出(Why)一个理想中的模型:我们希望鲁棒的图像处理模型具有空间不变性,...转载 2019-04-10 09:46:56 · 441 阅读 · 0 评论 -
RefineDet翻译版
论文:Single-Shot Refinement Neural Network for Object Detection论文链接:https://arxiv.org/abs/1711.06897代码链接:https://github.com/sfzhang15/RefineDetAbstract 对于物体检测,两阶段方法(例如,Faster R-CNN)已达到最高的精度,一阶...原创 2019-06-19 20:47:37 · 1000 阅读 · 0 评论 -
平均精度均值mAP
转载自:https://blog.csdn.net/asasasaababab/article/details/79994920 背景 之前在研究Object Detection的时候,只是知道Precision这个指标,但是mAP(mean Average Precision)具体是如何计算的,暂时还不知道。最近做OD的任务迫在眉睫,所以仔细的研究了一下mAP的计算。其实说实话,mA...转载 2018-11-28 11:27:30 · 4172 阅读 · 0 评论