vgg只使用3x3x1的卷积核
不难发现,两个3x3的卷积核所观察到的视野相当于一个5x5的卷积和所观察到的视野,三个3x3相当于一个7x7
所以我们使用多个小的卷积核代替大的卷积核,好处有什么呢:
1、使用合并了多个非线性层代替单个层,增加了模型的判别力
2、减少了参数的个数,3个3x3卷积层所需要的参数是3x(32xC2) = 27C2,而1个7x7的卷积层所需要的参数是1x(72xC^2) = 49C^2。所以虽然似乎有点不可思议,但实际上是减少了参数的个数。
1x1的卷积层,这样可以在不影响原网络感受野的情况下增加网络的非线性。