SSD的骨干网络是VGG16,yolo的骨干网络是googlenet。速度上googlenet比vgg16快,但是SSD比yolo快。这大部分原因是输入尺寸SSD是300,yolo是418。
SSD的网络结构:第一部分VGG,篮框是。第二部分extra那部分,绿框。
这几个画横线箭头的是输出层。每个输出层输出框四个坐标,和一个类别,类别包括了背景,所以voc是21类输出。
每个输出层输出的大小和个数不一样,要看mutibox函数。
最重要的是黄框那部分MultiBoxLoss。根据输出层给出的框priorbox、真实框gtbox求loss。这部分太难了
在这个链接有讲解https://hellozhaozheng.github.io/z_post/PyTorch-SSD/