最近一直没有继续看文献,刚刚将ssd的代码调通。实验室的席大师上次在讨论班中对yolov2和v3做了简单的介绍。个人感觉跟SSD框架在大方向上并没有过多差异,所以,准备对SSD以及yolov2+做一些个人理解的阐述。仅供大家参考。
1.SSD
SSD是北卡罗来纳大学的刘威在ECCV 2016提出的,它较于之前one-satge的yolo无论在准确度还是速度上面都有了较大的提升。在我看来,SSD的框架设计过程是faster rcnn 和yolo 两框架的结合,都将其最有优势的地方进行了完美结合。例如,fasetr中anchor box 的引入(SSD中成为default box).针对yolo中提出的基于网格的划分,ssd中也同样采用(文章当中是这么说的,但其实只是个概念问题,无论是在ssd,yolo系列,还是faster,都是对feature map 上进行逐点操作,所以并不存在网格区域的划分,即该过程并没有加速的过程)接下来,我将对两框架进行详细说明。文笔有限,语言逻辑不通顺的地方请私我!
放一张SSO tutorial 中各个框架的效果比较图:
首先比较一下ssd与faster,ssd采用faster中anchor box的辅助手段进行训练,同时去掉比较耗时的rpn阶段(fa