Keras版Faster-RCNN代码学习(IOU,RPN)1
Keras版Faster-RCNN代码学习(Batch Normalization)2
Keras版Faster-RCNN代码学习(loss,xml解析)3
Keras版Faster-RCNN代码学习(roipooling resnet/vgg)4
Keras版Faster-RCNN代码学习(measure_map,train/test)5
RoiPooling
参考文献:Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition
ROIs Pooling简单来说,是Pooling层的一种,而且是针对RoIs的Pooling,他的特点是输入特征图尺寸不固定,但是输出特征图尺寸固定;在faster RCNN中输出的是一个7×7的固定特征图。
ROI pooling的图
输出的shape为(1, num_rois, channels, pool_size, pool_size) (为channel first),图片的batch为1故第0维,TimeDistributed包装器默认维度1为时间维,故num_rois在第1维,再参考关于Keras的“层”(Layer) 和 编写自己的层
RoiPoolingConv.py
from keras.engine.topology import Layer
import keras.backend as K
if K.backend() == 'tensorflow':
import tensorflow as tf
class RoiPoolingConv(Layer):