Faster RCNN算法演进

最新推荐文章于 2019-11-01 22:08:16 发布

koibiki

最新推荐文章于 2019-11-01 22:08:16 发布

阅读量646

点赞数

分类专栏：目标检测文章标签： faster rcnn 目标检测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/koibiki/article/details/83538022

版权

目标检测专栏收录该内容

0 篇文章 0 订阅

订阅专栏

目标检测RCNN算法经历了RCNN->FAST RCNN->FASTER RCNN的递进演化。

RCNN原理及实现步骤

1. 在cpu端提取候选框：通过纹理或色彩等传统算法（SelectiveSearch）在原图中找到可能的候选框，通常为1k～2k个

2. 将候选框归一缩放为统一大小，分别输入cnn网络提取特征

3. 使用svm或softmax分类器分类，对于有目标框回归目标框体。

缺点：

需要现在cpu上预处理图片，处理步骤过多，每个region都要进行一次cnn前向传播，多次重复计算

FAST RCNN原理及实现

与RCNN最大的区别在于FAST CRNN是对一整张图进行卷积抽取特征，而RCNN是对每一个proposal分别进行卷积运算。

当FAST RCNN卷积完成后，会连接一个ROI Pooling层。这个层的作用主要是用于特征尺寸变换，其输入是卷积完成的特征图和SelectiveSearch提取出来的Proposal。因为原图与特征图存在对应关系，所以每个proposal也对应特征图上的一个特定区域。ROI Pooling会将该区域均匀地分割为M×N个网格，然后对每个网格做pooling，最后拉平成一个（M×N）x1 大小的1维向量，传入后续的全连接中做分类和框体回归。
尽管ROI Pooling可以看做是针对ROI区域的feature map的Pooling操作，但因为不是固定尺寸的输入，因此每次的pooling网格大小得手动计算。

这里写图片描述

FASTER RCNN实现原理

faster rcnn在上面的基础上更近了一步，将proposal的生成部分放到了roi层中。

anchor机制：

生成propoasl的规则基于anchor机制，对于卷积完成的特征图，根据给出一个基准窗大小，按照倍数和长宽比例得到不同大小的窗。例如论文中基准窗大小为16，给了（8、16、32）三种倍数和（0.5、1、2）三种比例，这样能够得到一共9种尺度的anchor。当最终特征图为M×N大小时，所生成的anchor数量就为 M×N×9个。

样本生成机制：

生成anchor后，需要对anchor进行筛选，与实际的样本label组成正样本与负样本。

1）假如某anchor与任一目标区域的IoU最大，则该anchor判定为有目标；

2）假如某anchor与任一目标区域的IoU>0.7，则判定为有目标；

3）假如某anchor与任一目标区域的IoU<0.3，则判定为背景。

所谓IoU，就是预测box和真实box的覆盖率，其值等于两个box的交集除以两个box的并集。正负样本均随机选择128个参与训练，其它的anchor不参与训练。

结果筛选NMS：

最终会生成很多候选框，之中很多是重叠的。FASTER RCNN准确率准确率最大的为基准，对于相互间IoU不大于0.7的目标框，只保留准确率高的候选框。然后在剩余的选择top-N，前300个框用于训练。

代价函数定义为：

注意，对回归框坐标的loss，只对正样本进行计算。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Faster RCNN算法演进

目标检测RCNN算法经历了RCNN-&gt;FAST RCNN-&gt;FASTER RCNN的递进演化。RCNN原理及实现步骤1. 在cpu端提取候选框：通过纹理或色彩等传统算法（SelectiveSearch）在原图中找到可能的候选框，通常为1k～2k个2. 将候选框归一缩放为统一大小，分别输入cnn网络提取特征3. 使用svm或softmax分类器分类，对于有目标框回归目标框...
复制链接

扫一扫

专栏目录

koibiki CSDN认证博客专家 CSDN认证企业博客

码龄13年

32: 原创

13万+: 周排名

94万+: 总排名

19万+: 访问

: 等级

2009: 积分

70: 粉丝

92: 获赞

86: 评论

507: 收藏

私信

关注

热门文章

分类专栏

CMT跟踪算法 3篇
移动端深度学习 3篇
GPGPU 5篇
opengl es 1篇
通用计算
android 2篇
ubuntu 1篇
爬虫 1篇
深度学习 13篇
winograd 2篇
算法 4篇
笔记 11篇
目标检测
hadoop 2篇
pytorch 1篇
opencv 1篇
OCR 1篇

最新评论

GPGPU基础（五）：使用compute shader进行通用计算及示例
形上为道: 这个和OpenCL相比，效率如何？
在Android端使用OpenGL的compute shader加速计算
形上为道: 可以不创建GLsurfaceView或者其它控件进行计算吗，可以做到只计算不显示UI吗
快速匹配字符串算法BK树原理及python实现
ricojia: 博主的cython 代码非常有用！我在看这篇文章之前也尝试了cython, 但是比博主的要慢5倍左右.我做了static typing, 但是没有内存管理。 [code=python] from libcpp.string cimport string from libcpp.vector cimport vector def levenshtein_dist(string str1, string str2): cdef int width = str1.length() + 1 cdef int height = str2.length() + 1 cdef vector[vector[int]] matrix = vector[vector[int]](height, vector[int](width, 0)) matrix[0] = list(range(width)) for r in range(height): matrix[r][0] = r for r, row in enumerate(matrix): if r == 0: continue for c, col in enumerate(row): if c == 0: continue rw = r - 1 cw = c - 1 if str1[cw] == str2[rw]: matrix[r][c] = matrix[r-1][c-1] continue else: matrix[r][c] = min([matrix[r-1][c-1], matrix[r-1][c], matrix[r][c-1]]) + 1 return matrix[height-1][width-1] [/code]
在Android端使用OpenGL的compute shader加速计算
AIGC Studio: 创建并链接shader程序的main函数要放在哪里呢
opencv中calcOpticalFlowPyrLK实现的光流法(Lucas-Kanade Method for Sparse Optical Flow)原理解析 (摘要翻译)
灬TheNobody灬: 应该在modules/video/src/lkpyramid.cpp里面，用的是稀疏光流SparsePyrLKOpticalFlow继承的SparseOpticalFlow

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。