一、网络结构
基本概念
如果输入的是一个RGB图像,那么就会有3个通道。“channel”通常被用来描述“layer”的结构。相似的,“kernel”是被用来描述“filter”的结构。
来自 <深度学习中的各种卷积_滤波器>
输入是一个5x5x3的矩阵,有三个通道。filter是一个3x3x3的矩阵。首先,filter中的每个卷积核分别应用于输入层中的三个通道。执行三次卷积,产生3个3x3的通道。
然后,这三个通道相加(矩阵加法),得到一个3x3x1的单通道。这个通道就是在输入层(5x5x3矩阵)应用filter(3x3x3矩阵)的结果。
卷积神经网络大小固定在224*224RGB大小,并对其进行预处理:average(图像像素数据-RGB值),将图片放在卷积神经网络(3*3)里面进行计算,池化是2*2 步长为2,卷积的步长为1
</