目标检测（一）

最新推荐文章于 2024-04-23 08:28:13 发布

萝卜丝。

最新推荐文章于 2024-04-23 08:28:13 发布

阅读量196

点赞数

分类专栏：基于深度学习的目标检测（笔记）文章标签：基于深度学习的目标检测（笔记）

原文链接：https://www.bilibili.com/video/av19359393/?p=2&t=360

版权

基于深度学习的目标检测（笔记）专栏收录该内容

3 篇文章 0 订阅

订阅专栏

深度方法
1，表示（数据驱动表示学习机制）
（1）根据训练数据自适应地构造特征提取器
（2）需要大量带标注的数据
（3）学习过程中和所学到表示难以进行解释（可视化）
2，模型（高度非线性）
（1）能有效建模物体的复杂变化模式
（2）能够方便的从单类别扩展至多类别
（3）特征提取和分类器可以整体进行端到端训练
（4）模型的计算复杂度高、
（5）理论上难以分析，泛化，收敛，样本复杂度高
2，两大类典型的检测方法
（1）两阶段检测器
生成可能包含物体候选区域region proposal
对候选区域做进一步分类和校准，得到最终的检测结果
（2）单阶段检测器single-shot
直接给出最终的检测结果
没有显示的生成候选区域的步骤

r-cnn系列 r-cnn->spp-net->fast r -cnn->faster r-cnn

r-cnn
1，基本框架在这里插入图片描述
用监督预训练解决表示学习，需要大量标注数据的问题
仅生成少量候选区域来解决模型计算速度慢的问题
第一步：生成候选区域
（1）传统方法：滑动窗口+图像金字塔
（2）专门的候选区域生成方法：sekective search
在这里插入图片描述
1）用现有的分割方法将图像快速划分成多个区域
2）给予相似度对相邻的区域进行合并
3）不断合并区域知道整张图像成为一个区域（层次化区域）
4）在合并区域的过程中，基于所有产生的区域给出对应的矩阵框，得到用于目标检测的候选区域（穷举法）
无监督：没有训练过程，不需要带标注的数据
数据驱动：根据图像特征生成候选区域
基于图像分割任务在这里插入图片描述
第二步，用cnn提取区域特征

（1）有监督预训练pretraining
图像分类任务：imagenet,1000类，仅有图像标签，没有物体边框标注
数据量：120万张图像
（2）针对目标任务进行微调
目标检测任务: pascalvoc，20类，有物体边框标注
数据量：仅有数千或上万张图像
*微调是可选步骤，担起有助于进一步提升检测精度（用大数据学习的预训练模型，其提取的特征值已经拥有较好的迁移能力）

第三步对区域进行分类
（1）线性svm分类器
针对每个类别单独训练
两类分类：one-vs=all
在这里插入图片描述
(2) softmax
和整个cnn一起端到端训练
所有类别一起训练
多类分类

边框校准
让检测框的位置更加准确，同时框的更加紧致（包含更少的背景区域）
线性回归模型
基本框架

问题：
（1）cnn要求输入图像具有统一尺寸
1）不同尺度与长宽比的区域被变换到相同的大小
2）裁剪会导致信息丢失（或引入过多背景），缩放会导致物体变形（对尺寸的限制仅在全连接层）
解决方案：
（1）卷积：允许任意大小的图像输入网络
（2）spp（空间金字塔池化）将不同大小的特征图归一化到相同大小（即不同大小的图片通过不同的划分方式，得到相同的个数）（优：对整张图计算卷积分特征，去除各个区域的重复计算）在这里插入图片描述（3）全连接：接受固定为度的输入

问题：
（1）r-cnn和spp-net的训练都包含多个单独的步骤
1）对网络进行微调
r-cnn对整个cnn进行微调
spp-net只对spp之后的全连接层进行微调
2）训练svm
3) 训练边框回归模型
时间长：需要cnn提取所有孙莲样本的特征
占用存储空间大，所有样本的特征都需要存储到磁盘上
（2）检测速度慢，尤其是r-cnn
解决方案 fast r-cnn
（1）保留spp-net的优势-》简化spp为单尺度：rolpooling
(2) 引入多任务学习，将多个步骤整合到一个模型中
在这里插入图片描述
（3）边框回归：
（4）全连接层加速

问题：
fast r -cnn 荏苒需要专门的候选窗口生成模块
解决方案：
rpn
（1）用cnn来生成候选窗口
（2）让生成候选窗口的cnn和分类的cnn共享卷积层

在这里插入图片描述
（3）如何产生不同大小的窗口
anchor box：不同尺度，不同长宽比

在这里插入图片描述

（4）模型学习：
1）交替式4步法训练
1，基于预训练模型训练rpn
2，基于预训练模型，以及上一步的到的rpn，训练fast r -cnn
3, 固定共享的卷积层，训练rpn
4，固定共享的卷积层，基于上一步得到的rpn，训练fast r-cnn
2）端到端训练
1，同时训练rpn和分类网络
2，分类网络的梯度不向rpn回传
在这里插入图片描述

|

萝卜丝。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
目标检测（一）

深度方法1，表示（数据驱动表示学习机制）（1）根据训练数据自适应地构造特征提取器（2）需要大量带标注的数据（3）学习过程中和所学到表示难以进行解释（可视化）2，模型（高度非线性）（1）能有效建模物体的复杂变化模式（2）能够方便的从单类别扩展至多类别（3）特征提取和分类器可以整体进行端到端训练（4）模型的计算复杂度高、（5）理论上难以分析，泛化，收敛，样本复杂度高2，两大类典型...
复制链接

扫一扫