在这里我们来说一说,基于vgg16的ssd的整体网络结。
首先,先来说一遍vgg16。如图,在图中D列就是今天要说的vgg16结构。
如图,下图为vgg16的结构示意。
简单的来说一下,
第一个肯定是输入(图片),224*224*3指的是图片的分辨率是224*224,通道数是3。
到了block1处,卷积核为3*3*3,有64个这样子的卷积核。3*3*3是因为对一个通道有3*3大小的卷积核, 共有三个通道,故卷积核为3*3*3。完成卷积计算后,我们会得到一个224*224*64的featuremap(卷积层),然后我们再将其卷积一次并保持大小不变,得到了另一个224*224*64的featuremap(卷积层),在这里的卷积核大小为3*3*64*64,3*3*64的意思是有64层卷积范围为3*3的卷积操作,这样卷积操作(卷积核)有64个。
进行池化操作,将一个224*224*64调整为112*112*64,。
到了block2处,这里的卷积核为3*3*64,有128个这样子的卷积核,为什么是3