GBD-Net的finetune有两步,第一步是微调一个没有GBD模块的基础网络,第二步是微调一个插入GBD之后的网络,然后两个模型整合到一起得到最终的模型。(怎么整合的?)
图1
可以看到没有GBD的基础网络微调model中有一层roi-pooling,最近经常看到,现在来学习一下。
FasterRcnn在输入的时候,对不同尺度的图像进行了reshape归一,而在对目标区域进行学习的时候,因为会生成各种尺度的框,所以也需要一个层来进行reshape,roi-pooling就是干这个事情的,跟前者的区别是:前者是针对输入图像的,后者是针对roi的,即输入是不同大小的featuremap,输出是固定尺寸的featuremap 。现在,我们定位出了它的位置以及需要发挥的功能,那么我们来看看roi-pooling的操作对象:ROI。
ROI就是region of interest,说白了就是感兴趣区域,如果是原图,roi就是目标,如果是featuremap,roi就是特征图像目标的特征了。总之就是一个框。它在Fast-RCNN中和Faster-RCNN中有所区别:前者是经过Selective Search得到的,后者是经过RPN得到的。就是推荐框的