在 Mask RCNN 中,预设 anchor 数量从 Faster RCNN 的 9 个, 提升到了 15 个。这里ratio=[0.5,1,2],而scale在每一层 feature map 上(stride=4,8,16,32,64)的尺度都是 8,映射到原图尺度上就是scale=[32,64,128,256,512]
假设图像尺寸为(H, W), 特征图的stride=S1,S2,S3,S4,S5, 则特征图尺寸为(
H
/
S
i
H/S_{i}
H/Si,
W
/
S
i
W/S_{i}
W/Si)
在每层特征上,scale=s.
1 RPN Head