rcnn中使用selective search选择了2000+的region propoals,然后将这些region propoasls transform 成227x227的大小过之后,送入CNN中。
有三种transformations方式,上图中,
A 是原图;
B(tightest square with context)是将原图A放入到最紧密的并且能够包含原图A的正方形中,然后使用上下文信息进行填充,然后将其resize为227x227,这种填充过之后的图像,虽然不是227x227,但是是正方形的,因此直接resize,没有损坏长宽比。
C(tightest square without context)是将原图A放入到最紧密的并且能够包含原图A的正方形中,不使用上下文填,使用均值进行填充,然后将其resize为227x227, 这样是为了保证227x227中的原图尺寸比例不变。
D(wap)直接破坏原图A 的尺寸,直接resize为227x227;