1.ROI简介
1.ROI是经过最后Conv层后feature map的一个矩形框
2.每个ROI由(r,c,h,w)组成。r,c指的是左上角的坐标;h,w指的是宽和高
ROI Pooling 把一个h x w 大小的格子划分为H x W个格子,
因而每个格子的大小为(h/H, w/W)
注意,无法整除的话就会出现取地板除,对应的取ceiling
对每个格子分别做max pooling
2.Example
feature map:8x8,
一个ROI,
输出:为2*2
(这里所谓的输入输出都是针对last Conv层).
1.输入固定大小的feature map
2.region proposal 投影之后位置(左上角,右下角坐标):(0,3),(7,8)
好像明白了,region proposal是指的image的地方,而ROI指的是Conv层后的feature map上的位置
3.将其划分为(22)个grids(因为输出大小为22),我们可以得到
4.对每个grid做max pooling
说明:在此案例中region proposals 是57大小的,在pooling之后需要得到22的,所以在57的特征图划分成22的时候不是等分的,行是5/2,第一行得到2,剩下的那一行是3,列是7/2,第一列得到3,剩下那一列是4。
ROI Pooling 就是将大小不同的feature map 池化成大小相同的feature map,利于输出到下一层网络中。