RFCN: Region-based Fully Convolutional Networks
核心思想:
提出位置敏感得分图,用以解决图像分类中平移不变形和物体检测中平移变化之间的冲突
目前大部分的检测算法都是特征提取和目标检测两部分
上图说明: R-CNN是直接输入了proposal,整个网络都用作检测,Faster-R-CNN是后10层由于检测;而R-FCN是101层全部都共享权值
对 feature map 做1*1*1024(backbone的输出为1024通道)的卷积,设置输出通道数为k*k*(C+1)),这个通道数就是为每一个类别设置了k*k个scores值,C为类别数;则卷积之后的输出维度为W*