目标检测
文章平均质量分 60
一大块肉松
凡心所向,素履以往
展开
-
目标检测(四)——Mask R-CNN
相较于Faster R-CNN:这篇文章讲的很详细: Mask-RCNN 算法及其实现详解原创 2022-07-09 10:53:44 · 989 阅读 · 1 评论 -
目标检测(三)——Two-Stage——Faster R-CNN
(1)解决非端到端的问题; (2)解决Selective Search拉低速度的问题;所以整个Faster R-CNN 系统由两个模块组成: 第一个模块是提取候选区域的深度卷积网络 第二个模块是使用候选区域的Fast R-CNN检测(1)将图像输入到CNN中,生成feature map; (2)RPN(Region Proposal Network,区域候选网络),代替Selective Search,用于生成候选框,将第一步生成的feature map输入到RPN中,接下来进行两个任务,一是分类:用于判断原创 2022-07-09 10:35:27 · 386 阅读 · 0 评论 -
目标检测(二)——Two-Stage——Fast R-CNN
从上一节说的到R-CNN可以看出: 它的计算量很大,结构也分散,主要体现在:需要针对Selective Search方法生成的2000个候选框逐一进行计算、之后的分类和回归也是分开训练计算的。在训练的过程中,提取的特征需要先存储在硬盘上,然后训练SVM分类模型,最后训练bounding box回归模型,测试的过程,也是相类似,特征提取之后,先进行SVM分类,然后进行回归目标的准确位置,整个计算过程需要很大的开销。在R-CNN的目标检测网络提出之后,针对R-CNN 的特征提取网络要求输入图像为固定尺寸以及每个原创 2022-07-08 14:56:15 · 682 阅读 · 0 评论 -
目标检测——SPP-Net
SPPnet:Spatial Pyramid Pooling in Deep Convolution Networks for Visual Recognition(空间金字塔池化)1、R-CNN这个深度卷积神经网络需要输入固定尺寸的图像,经过Selective Search之后选出的2000个候选框的尺寸必定不同,在传入网络之前,就需要对图像进行截取或者拉伸,这样很大可能改变了图像原来的尺寸,极大影响了检测结果。 2、R-CNN中2000个候选框,需要进行2000次的CNN操作,重复的卷积工作,造成资源消原创 2022-07-08 10:34:31 · 209 阅读 · 0 评论 -
目标检测(一)——Two-Stage——RCNN
因为是第一篇,所以这里记录一点基础: 分类、检测、分割的区别: (1)图像分类:只需要指明图像中相应目标所属的类别就可以; (2)目标检测:需要定位到目标所处的位置,用矩形框表示; (3)目标分割:a. 语义分割:需要找到当前目标所占的区域,去除背景区域,其他目标的区域;b. 实例分割:不仅需要区分不同语义的目标,而且对于同一类别的目标也需要划分出不同的实例;下面这张图像就对应了上述的情况(图像来源) 接下来都是学习目标检测系列的网络(深度学习)二者的最大区别在于是否包含RPN(候选区域目标推荐)的过程,即原创 2022-07-07 21:12:41 · 1550 阅读 · 0 评论