说明
这篇博文是学习了百度飞桨目标检测7日打卡训练营后写的笔记,百度飞桨学习链接:https://aistudio.baidu.com/aistudio/education/group/info/1617
两阶段算法发展历程
R-CNN
核心思想
对每张图选取多个区域,然后每个区域作为一个样本进入一个卷积神经网络来提取特征
不足
- 计算量大:每个候选区域都需要通过CNN计算特征
- 质量差:selective search提取的区域质量不够好
- 训练时间长:特征提取、SVM分类器是分模块训练,没有联合起来系统优化
补充:selective search(选择性搜索),先利用基于图的图像分割的方法得到小尺度的区域,然后根据每个区域的相似度合并得到大的尺寸。为了增强合并的多样性,考虑多种颜色空间(RGB,HSV,灰度等),多种相似度度量标准(颜色,纹理,大小等),多种分割阈值等方法。
Fast R-CNN
核心思想
将R-CNN中对候选框resize的操作改为RoI Pooling的方式,将SVM分类用softmax分类代替,简化R-CNN计算复杂度
RoI pooling
不足
候选区域仍然采用selective search的方法,提取候选框区域耗时长
ROI pooling原理,参考这篇博文:
https://blog.csdn.net/u011436429/article/details/80279536
Fast R-CNN原理详细介绍,参考这篇博文:
https://blog.csdn.net/u014380165/article/details/72851319
Faster R-CNN
核心思想
RPN(Region Proposal Network)替代selective search提取候选区域
Faster RCNN总体工作流程
第一阶段:产生候选区域
- 使用Anchor替代Selective Search,选取候选区域
- 选出包含物体的Anchor进入RoI Pooling提取特征
第二阶段:对候选区域进行分类并预测目标物体位置
RPN工作流程
或
RPN损失函数
Faster R-CNN原理详细介绍,参考这篇博文:
https://zhuanlan.zhihu.com/p/31426458