论文:Fast R-CNN [code]
论文:Faster R-CNN [code]
R-CNN:
Region proposals:采用Selective Search 方法(分割->合并) 生成候选框Feature extraction:对每个候选区域,resize成227*227尺寸,使用深度卷积网络提取特征 (CNN)Object category classififiers:一旦提取特征并应用训练标签,我们就对每个类优化一个线性SVM。
Fast R-CNN:
解决R-CNN速度精度问题
- 对整张大图CNN(而不是每个候选区进行CNN)
RoI pooling layer: 每个预测框的RoI由一个四元组(r,c,h,w)定义,它指定其左上角(r,c)及其高度和宽度(h,w)。RoI max池的工作方法是将h×w RoI窗口划分为H×W网格,得到一个统一大小的输出 分类loss+区域loss
Faster R-CNN:
- 引入RPN(为feature map的每一个点都预先定义k个anchor box,再由该点的特征来表示对anchor box调整与类别预测)
ROI pooling:RPN预测后的proposal 由2000个靠score筛选签300个进行POI poling然后loss计算等