原文 | https://arxiv.org/abs/1901.07518
Faster R-CNN算法及其实现详解:https://zhuanlan.zhihu.com/p/31426458
Mask-RCNN 算法及其实现详解:https://blog.csdn.net/remanented/article/details/79564045
传统的Faster R-CNN结构如下:
在train阶段,其最终的输出结果是通过如下一个简单的IoU阈值判断来决定哪些proposal作为output
Cascade R-CNN Innovation
作者的Idea,是设计cascade的bbox cls/reg机制:
总共有三个roi-wise subnet相cascade (级联) ,每个roi-wise subnet采用不同的IoU阈值。依次为0.5、0.6、0.7。
对应的网络结构如下:
具体可参考: