Deformable ConvNets v2: More Deformable, Better Results
分析DCN
Spatial Support Visualization
- Effective receptive fields
理论上现在很多深层网络最后feature上每个位置的视野域都是铺满全图的,但是实际视野域中每个点对响应的不同,有效视野域即为输入扰动后实际能对输出产生影响的区域。比如求conv2上某一位置的有效视野域,那就依次扰动图像观察该位置处的输出变化,看看哪些像素点能对输出产生影响。一般来说输出点对应回去的中心点对输出影响最大。 - Effective sampling/bin locations
DCNv1中只对采样位置进行了可视化,但是每个采样位置的权重也是不一样的,现在对采样点或者采样的bin的位置和权重都进行了可视化 - Error-bounded saliency regions
已经有一些工作做mask掉图片一些区域使最后输出没有变化,在这个基础上我们可以可视化出最小的能给出和原始一样的输出,也即是最小的最有效识别部分
spatial support of nodes in the last layer of the conv5 stage
图中第一行是Effective sampling/bin locations,第二行是Effective receptive fields,第三行是Error-boun