目标检测（3）—深度学习目标检测算法

最新推荐文章于 2022-12-17 23:24:05 发布

hezuo1181

最新推荐文章于 2022-12-17 23:24:05 发布

阅读量893

点赞数 2

分类专栏： s

本文链接：https://blog.csdn.net/hezuo1181/article/details/89103057

版权

s 专栏收录该内容

10 篇文章 3 订阅

订阅专栏

基于Two-stage的目标检测算法

CNN卷积特征（卷积神经网提取特征）
R-CNN->faster rcnn
端到端的目标检测（RPN网络）
准确度高，速度比one-stage慢

TWO-stage基本流程

一张图片作为输入
卷积神经网络（conv&pooling)->通常称为主干网络

典型的主干网络：VGG,RESNET等

conv+roi_pooling(RPN网络）代替滑动窗口产生候选区域（proposal），同时也会对候选区域分类，分为背景和目标两种，也会对目标的位置进行初步的预测（区域分类，位置精修）
Roi_pooling（抠图）
Fc进一步对候选区域进行表示
分类和回归分别对候选目标类别的判定和位置的精修

Two-stage常见算法

RCNN
Sppnet
Fast-rcnn
Faster-rcnn

Two-stage核心组件

CNN网络（卷积神经网络）

CNN网络设计原则：—>主干网络的设计原则

从简到繁到简的卷积神经网

LENET->VGG等（网络深度加深)，resnet一百多层->inception->mobilenet(轻量级网络结构），压缩模型大小（在尽可能不损失性能的同时。

尽可能地加深网络可以得到物体更加抽象的表达。越深层次的网络，鲁棒性越好。同时也会导致梯度消失，

多尺度特征融合的网络
更轻量级的cnn网络（mobilenet)，对于产品的落地具有重要意义。

RPN网络

输入的图片在经过前面的主干网络（卷积神经网络，cnn层）之后，会产生提取出来的feature naps(n,c,w,h)四维的卷积特征。

n:batch-size的数量（当前处理样本的数量）

C:feature map的个数（channel（卷积核）的个数）

W:当前feature map的宽（可能和原始图片相差一定的倍数）

H:当前feature map的长（可能和原始图片相差一定的倍数）

进行卷积的时候可能没有使用padding的策略保证和原始图片一样的大小，可能也是由于使用pooling层的时候采用下采样，得到更大的感受野。

区域推荐算法（Anchor机制），对候选区域进行筛选

Feature map大小：n*c*w*h

对于每个feature map(w*h)选择每一个点作为anchor，这个anchor就是候选区域的中心点。根据每个anchor来提取候选区域。候选区域通常会按照一定的比例来选择，对于fast rcnn来说，每一个anchor采用9个不同的尺度采取九个候选区域。则每个feature map(W*H)会得到w*h*9个候选区域。

候选区域被提取出来之后，会利用真值（GT)对候选区域进行筛选。通过筛选之后得到正样本（包含了候选目标的区域）和负样本（表示不包含目标的候选区域）。正负样本的划分通常会根据IOU来判定。IOU>0.7（O.7是超参数，可以调整的）则是正样本。所谓IoU，就是预测box和真实box的覆盖率，其值等于两个box的交集除以两个box的并集。

ROI Pooling，通过ROI Pooling提取候选目标

输入：特征图，rois(1*5*1*1)->区域坐标，以及ROI参数（1/8之类，feature map是原始图片的1/8）

>_xywh（第一个数据表示是索引值，batchsize中的哪一张图片）

输出：固定尺寸的feature map

相当于完成了抠图+resize(固定到一定大小，保证参数大小是固定的）

分类和回归：通过一个分类和回归网络对候选区域进行精确的分类和坐标位置的回归

Two-stage改进方向

更好的主干网络
更精准RPN
更完善的ROI分类
样本后处理,数据增强
更大的mini-Batch

基于One-stagede 目标检测算法

使用cnn卷积特征
直接回归物体的类别概率和位置坐标值（无region proposal)，不包括RPN网络
准确度低，速度相对于two-stage快

One-stage基本流程

给定一张图片作为输入
通过主干网络完成cnn特征的提取（cnn特征提取）
直接进行区域的回归和目标的分类（区域分类，位置精修）

One-stage常见算法

yolov1/v2/v3
SSD/DSSD等
Retn-net
等等

One-stage核心组件

CNN网络（主干网络）

CNN网络设计原则：—>主干网络的设计原则

（1）从简到繁到简的卷积神经网

LENET->VGG等（网络深度加深)，resnet一百多层->inception->mobilenet(轻量级网络结构），压缩模型大小（在尽可能不损失性能的同时。

尽可能地加深网络可以得到物体更加抽象的表达。越深层次的网络，鲁棒性越好。同时也会导致梯度消失，

（2）多尺度特征融合的网络

（3）更轻量级的cnn网络（mobilenet)，对于产品的落地具有重要意义。

参数量越少代表着模型越不容易过拟合，更少的参数量减少资源的消耗，防止过拟合问题的产生。

回归网络

输入：通过cnn卷积神经网络提取特征得到的feature map作为回归网络的输入。

回归网络主要完成：

区域回归（置信度.位置,类别）

通过回归网络直接输出目标的bounding box的位置信息。在回归过程中会得到置信度（表达当前的bounding box中是否存在目标，存在则是目标区域，不存在则是背景区域）和类别。

Anchor机制（SSD)

hezuo1181

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
目标检测（3）—深度学习目标检测算法

基于Two-stage的目标检测算法CNN卷积特征（卷积神经网提取特征） R-CNN->faster rcnn 端到端的目标检测（RPN网络）准确度高，速度比one-stage慢TWO-stage基本流程一张图片作为输入卷积神经网络（conv&pooling)->通常称为主干网络典型的主干网络：VGG,RESNET等conv+roi_po...
复制链接

扫一扫