为什么传统CNN结构神经网络的输入图片尺寸是固定的?
对于CNN来说,一张图片经过conv和pooling时,这些层是不关心图片大小的。比如对于一个卷积层,output_size=(input_size - kernel_size)/stride + 1,它并不关心输入图片的尺寸大小,但是经过若干次conv和pooling后,要经过flatten操作送入FC层中,此时我们得提前设置好hidden layer中神经元的个数,这一步需要考虑经过flatten后的大小,所以传统的CNN结构神经网络的输入图片尺寸必须是固定的,例如AlexNet,VGG,ResNet
复制链接