注:这是写给自己看的学习笔记,如有错误敬请指出。
1.卷积神经网络的结构
由四层构成,分别为:输入、卷积、池化、输出层。
2.卷积神经网络的形象理解
2.1卷积层的形象理解
卷积层的目的实际上是进行特征的提取。
在卷积层(convention layer)中,使用一个过滤器(kernel)去扫描一个图像,这个过滤器的参数是需要学习的。过滤器与图像进行卷积并滑动,会生成这个图像的特征映射(feature map)。
此处可以深究的问题是:如何选取合适的过滤器、如何确定过滤器的大小等。(书中说一般是5*5)
过程如下图所示:
2.2池化层的形象理解
对于一个N*N的图像以及一个M*M的卷积核,卷积完成后的特征映射大小为:(N-M+1)*(N-M+1)。
因此要进行信息的压缩,这就是池化层的简单意义。
此处可以深究的问题是:使用什么池化方式(如著名的最大池化:选择池化区域中最大的作为池化输出),池化区域的大小是怎么划分的(一般是2*2生成1这样进行池化,信息会被压缩成原来的1/4)。
池化完毕后就送到输出层进行输出了。
过程如下图所示:
3.卷积神经网络的公式
3.1符号说明
3.2 输入层的公式
1.输入:为图像的像素值,对于N*N大小的图来说,
2.输出:设输入层 I 的第i行j列的神经单元输出为。
3.则有:=, 即此层不进行任何操作,直接输出。
3.3卷积层的公式
对于编号为k的过滤器,我们计算他的卷积层的输出。 书上似乎说,一个过滤器对应一个卷积层和一个池化层。
1.输入:来自输入层,其实就是图像的像素值,对