首先需要说明的是,本文在写时仅仅依靠着对论文的解读,具体代码的实现还没有看。最终可能也不一定会看源码,会找一个合适的进行详细的学习。通过阅读以下两篇论文及翻译,总结出一些网络的特点记录在这里,方便之后的查找。
Faster R-CNN https://arxiv.org/abs/1506.01497
翻译:https://blog.csdn.net/quincuntial/article/details/79132243
SSD https://arxiv.org/abs/1512.02325
翻译:https://blog.csdn.net/quincuntial/article/details/78854930
这两篇文章是2016年具有开拓性的两篇目标检测类的文章。
Faster R-CNN
Conv layers。作为一种CNN网络目标检测方法,Faster RCNN首先使用一组基础的conv+relu+pooling层提取image的feature maps。该feature maps被共享用于后续RPN层和全连接层。
Region Proposal Networks。RPN网络用于生成region proposals。该层通过softmax判断anchors属于foreground或者background,再利用bound