卷积神经网络基本组成结构
卷积层
卷积是对两个实变函数的一种数学操作。给定一个图像和滤波器,则,输出的特征图大小为。输出通道数等于卷积核的个数,卷积核通道数与输入通道数保持相同。
池化层
池化层保留了输入的主要特征的同时减少了参数和计算量,防止过拟合,提高模型泛化能力。
它一般处于卷积层与卷积层之间,全连接层与全连接层之间。池化层主要分为最大值池化(Max pooling)和平均池化(Average pooling)两种。
池化不改变通道数。
全连接层
全连接层的两层之间所有神经元都有权重链接,往往接在卷积神经网络尾部,并通常具有最大的参数量。
卷积神经网络典型结构
AlexNet
AlexNet 是具有历史意义的一个网络结构,它在2012年的ImageNet图像分类竞赛中错误率比上一年的冠军下降了十个百分点,而且远远超过当年的第二名。
层数 | 说明 | 节点数量 | 参数数量 |
C1 | 96个11x11x3卷积核 | 55x55x48x2=290400 | 11x11x3x96+96=34848 |
C2 | 2组128个5x5x48卷积核 | 27x27x128x2=186624 | (5x5x48x128+128)x2=307456 |
C3 | 384个3x3x256卷积核 | 13x13x192x2=64896 | 3x3x256x384+384=885120 |
C4 | 2组192个3x3x192卷积核 | 13x13x192x2=64896 | (3x3x192x192+192)x2=663936 |
C5 | 2组128个3x3x192卷积核 | 13x13x128x2=43264 | (3x3x192x128+128)x2=442624 |
FC6 | 4096个神经元 | 4096 | (6x6x128x2)x4096+4096=37752832 |
FC7 | 4096个神经元 | 4096 | 4096x4096+4096=16781312 |
Output layer | 1000个神经元 | 1000 | 4096x10 |