基于深度学习的目标检测（object detection）技术演进

最新推荐文章于 2020-11-20 19:38:58 发布

Lovefeifei20200119

最新推荐文章于 2020-11-20 19:38:58 发布

阅读量146

点赞数

分类专栏：学习深度学习

本文链接：https://blog.csdn.net/qq_28019591/article/details/83275538

版权

学习同时被 2 个专栏收录

31 篇文章 2 订阅

订阅专栏

深度学习

26 篇文章 1 订阅

订阅专栏

参考文章：https://www.cnblogs.com/skyfsm/p/6806246.html

RCNN->SppNET（空间金字塔池化）->Fast-RCNN->Faster-RCNN

1、Pre-train 与 Fine-tuning的区别：

Pre-train的model就是指之前被训练好的Model, 比如很大很耗时间的model, 你又不想从头training一遍。这时候可以直接download别人训练好的model，里面保存的都是每一层的parameter配置情况。(Caffe里对于ImageNet的一个model, 我记得是200+M的model大小)。你有了这样的model之后，可以直接拿来做testing, 前提是你的output的类别是一样的。

如果不一样咋办，但是恰巧你又有一小部分的图片可以留着做fine-tuning, 一般的做法是修改最后一层softmax层的output数量，比如从Imagenet的1000类，降到只有20个类，那么自然最后的InnerProducet层，你需要重新训练，然后再经过Softmax层，再训练的时候，可以把除了最后一层之外的所有层的learning rate设置成为0，这样在traing过程，他们的parameter 就不会变，而把最后一层的learning rate 调的大一点，让他尽快收敛，也就是Training Error尽快等于0.

2、genertive model and discriminative model：

- 生成模型(Generative Model) ：无穷样本==》概率密度模型 = 产生模型==》预测
- 判别模型(Discriminative Model)：有限样本==》判别函数 = 预测模型==》预测

proposal：一般被称作“目标大概可能的位置”。

3、总结：

RCNN
　　1. 在图像中确定约1000-2000个候选框 (使用选择性搜索)
　　2. 每个候选框内图像块缩放至相同大小，并输入到CNN内进行特征提取
　　3. 对候选框中提取出的特征，使用分类器判别是否属于一个特定类
　　4. 对于属于某一特征的候选框，用回归器进一步调整其位置

Fast RCNN
　　1. 在图像中确定约1000-2000个候选框 (使用选择性搜索)
　　2. 对整张图片输进CNN，得到feature map
　　3. 找到每个候选框在feature map上的映射patch，将此patch作为每个候选框的卷积特征输入到SPP layer和之后的层
　　4. 对候选框中提取出的特征，使用分类器判别是否属于一个特定类
　　5. 对于属于某一特征的候选框，用回归器进一步调整其位置

Faster RCNN
　　1. 对整张图片输进CNN，得到feature map
　　2. 卷积特征输入到RPN，得到候选框的特征信息
　　3. 对候选框中提取出的特征，使用分类器判别是否属于一个特定类
　　4. 对于属于某一特征的候选框，用回归器进一步调整其位置

Lovefeifei20200119

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
基于深度学习的目标检测（object detection）技术演进

参考文章：https://www.cnblogs.com/skyfsm/p/6806246.htmlRCNN->SppNET（空间金字塔池化）->Fast-RCNN->Faster-RCNN1、Pre-train 与 Fine-tuning的区别：Pre-train的model就是指之前被训练好的Model, 比如很大很耗时间的model, 你又不想从头trainin...
复制链接

扫一扫

专栏目录