Faster-RCNN 虽然在效果上做到了 State-Of-The-Art,但效率问题无法做到实时,YOLO 在此基础上提出了改进:
一. Region Proposal
Region Proposal 过程的优点是能够初步检测有效的 Candidate,缺点是带来效率的降低(Faster构造了两级网络)。
YOLO去掉了 Faster的 RPN 过程,直接预测物体的种类和位置。
这是一个里程碑似的 Idea!
二. 直接训练
YOLO 将目标的分类与定位进行合并,将对应位置的信息 通过网络,对应到最后面的 7*7的格子上,每个格子对应一个30维的向量,分别代表 分类与定位信息。对应图中 30维向量 = (B*5 + C),B是每个Grid对应Bound Box数量,Paper中值为2,C为分类数,值为20。
YOLO 网络图参考如下:
三. SSD 剖析
SSD全称是:Single Shot MultiBox Detector,作者是 UNC教堂山的 Wei Liu
论文下载地址:http://www.cs.unc.edu/~wliu/papers/ssd.pdf
1. 开山绝技 - 多尺度
这是对YOLO最大的改进,也是本算法的核心。
YOLO基于最后一张 Feature Map(特征图)进行提取和分类,某些细节特征的丢失导致精度下降和小目标遗漏。
与YOLO不同的是,SSD 在多个尺度(Feature Map)上进行了回归,低层的 feature map 蕴含更多的信息,有利于细节保留 及 训练误差回传,提高了精度及小目标的适应能力。
对于上图(b)(c)所对应 不同分辨率的 Feature Map,同样 3*3 的区域 代表了原图(a)上的目标,蓝色与红色框 的对应关系。