Faster Rcnn 救赎
工作了好久,发现有些东西陌生了好多,比如Faster Rcnn,不得不重新回顾一下。
不打算自己画图,真的很浪费时间,直接偷了,哈哈哈!
概述
Faster Rcnn组成
\qquad
Faster Rcnn将特征提取,proposal提取,bbox定位与分类整合到一个网络中,检测效果明显优于one-staged 方法。
上图为Faster Rcnn结构图,主要由四部分组成:
- conv layers
卷积层用于提取图像特征。输入为原始图像,输出为经cnn后提取的特征,Faster Rcnn使用连续的conv+relu+pooling操作提取图像特征,基于此图像特征进行后续的region proposal network与roi pooling。 - region proposal network
region proposal network,用于生成region proposals。输入为conv layers生成的图像特征,输出为基于anchor 回归的候选框。region proposal network将输入映射为具有一个置信度值以及四个坐标值的矩形框,置信度表示该矩形框中存在目标的概率,坐标值表示矩形框位置。 - roi pooling
- classifier