目标检测(一)

深度方法
1,表示(数据驱动表示学习机制)
(1)根据训练数据自适应地构造特征提取器
(2)需要大量带标注的数据
(3)学习过程中和所学到表示难以进行解释(可视化)
2,模型(高度非线性)
(1)能有效建模物体的复杂变化模式
(2)能够方便的从单类别扩展至多类别
(3)特征提取和分类器可以整体进行端到端训练
(4)模型的计算复杂度高、
(5)理论上难以分析,泛化,收敛,样本复杂度高
2,两大类典型的检测方法
(1)两阶段检测器
生成可能包含物体候选区域region proposal
对候选区域做进一步分类和校准,得到最终的检测结果
(2)单阶段检测器single-shot
直接给出最终的检测结果
没有显示的生成候选区域的步骤

r-cnn系列 r-cnn->spp-net->fast r -cnn->faster r-cnn

r-cnn
1,基本框架在这里插入图片描述
用监督预训练解决表示学习,需要大量标注数据的问题
仅生成少量候选区域来解决模型计算速度慢的问题
第一步:生成候选区域
(1)传统方法:滑动窗口+图像金字塔
(2)专门的候选区域生成方法:sekective search
在这里插入图片描述
1)用现有的分割方法将图像快速划分成多个区域
2)给予相似度对相邻的区域进行合并
3)不断合并区域知道整张图像成为一个区域(层次化区域)
4)在合并区域的过程中,基于所有产生的区域给出对应的矩阵框,得到用于目标检测的候选区域(穷举法)
无监督:没有训练过程,不需要带标注的数据
数据驱动:根据图像特征生成候选区域
基于图像分割任务在这里插入图片描述
第二步,用cnn提取区域特征
在这里插入图片描述
(1)有监督预训练pretraining
图像分类任务:imagenet,1000类,仅有图像标签,没有物体边框标注
数据量:120万张图像
(2) 针对目标任务进行微调
目标检测任务: pascalvoc,20类,有物体边框标注
数据量:仅有数千或上万张图像
*微调是可选步骤,担起有助于进一步提升检测精度(用大数据学习的预训练模型,其提取的特征值已经拥有较好的迁移能力)

第三步 对区域进行分类
(1)线性svm分类器
针对每个类别单独训练
两类分类:one-vs=all
在这里插入图片描述
(2) softmax
和整个cnn一起端到端训练
所有类别一起训练
多类分类
在这里插入图片描述
边框校准
让检测框的位置更加准确,同时框的更加紧致(包含更少的背景区域)
线性回归模型在这里插入图片描述
基本框架
在这里插入图片描述
问题:
(1)cnn要求输入图像具有统一尺寸
1)不同尺度与长宽比的区域被变换到相同的大小
2)裁剪会导致信息丢失(或引入过多背景),缩放会导致物体变形(对尺寸的限制仅在全连接层)
解决方案:
(1)卷积:允许任意大小的图像输入网络
(2)spp(空间金字塔池化)将不同大小的特征图归一化到相同大小(即不同大小的图片通过不同的划分方式,得到相同的个数)(优:对整张图计算卷积分特征,去除各个区域的重复计算)在这里插入图片描述 (3) 全连接:接受固定为度的输入

问题:
(1)r-cnn和spp-net的训练都包含多个单独的步骤
1)对网络进行微调
r-cnn对整个cnn进行微调
spp-net只对spp之后的全连接层进行微调
2)训练svm
3) 训练边框回归模型
时间长:需要cnn提取所有孙莲样本的特征
占用存储空间大,所有样本的特征都需要存储到磁盘上
(2)检测速度慢,尤其是r-cnn
解决方案 fast r-cnn
(1)保留spp-net的优势-》简化spp为单尺度 :rolpooling
(2) 引入多任务学习,将多个步骤整合到一个模型中
在这里插入图片描述
(3)边框回归:在这里插入图片描述
(4)全连接层加速
在这里插入图片描述
在这里插入图片描述
问题:
fast r -cnn 荏苒需要专门的候选窗口生成模块
解决方案:
rpn
(1)用cnn来生成候选窗口
(2)让生成候选窗口的cnn和分类的cnn共享卷积层

在这里插入图片描述
(3)如何产生不同大小的窗口
anchor box:不同尺度,不同长宽比

在这里插入图片描述
在这里插入图片描述
(4)模型学习:
1)交替式4步法训练
1,基于预训练模型训练rpn
2,基于预训练模型,以及上一步的到的rpn,训练fast r -cnn
3, 固定共享的卷积层,训练rpn
4,固定共享的卷积层,基于上一步得到的rpn,训练fast r-cnn
2)端到端训练
1,同时训练rpn和分类网络
2,分类网络的梯度不向rpn回传
在这里插入图片描述
在这里插入图片描述
| 在这里插入图片描述
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值