卷积神经网络中每层矩阵维度变化

最新推荐文章于 2024-10-02 18:13:53 发布

H-T-TYSK

最新推荐文章于 2024-10-02 18:13:53 发布

阅读量9.9k

点赞数 1

分类专栏：卷积神经网络 python 文章标签：神经网络卷积神经网络

本文链接：https://blog.csdn.net/yuyushikuan/article/details/78553636

版权

python 同时被 2 个专栏收录

14 篇文章 1 订阅

订阅专栏

卷积神经网络

1 篇文章 0 订阅

订阅专栏

卷积神经网络在图像识别上已经相当成熟．经典的识别手写字的卷积神经网络LeNet-5模型为７层的神经网络．其中每一层上面矩阵的维度的变换是图像像素得到识别的重点，而矩阵维度的变换是每一层之间使用卷积核大小所决定．LeNet-5模型在识别手写字方面最为经典：
（第０层），卷积神经网络的输入层为图片的矩阵，输入的图片为３２＊３２，因为每次输入的图片张数为１，因此input层的矩阵大小为：３２＊３２＊１．
（第一层）：卷积层(convolution layer)．
在LeNet-5的神经网络中，第一层使用的卷积核大小为５＊５＊１，卷积核（filter）的输出深度为６，使用不填充，步长为１．不填充的情况下，输出的矩阵大小为３２－５＋１＝２８．因此第一层卷积层的大小为２８＊２８＊６．
（第二层）：池化层(pooling layer)．
在有些文献，池化层被称为最大混合层（翻译问题不必深究）．池化层过滤器大小２＊２，步长为２．因此第二层的的大小为１４＊１４＊６．
（第三层）：卷积层
第二层的大小为１４＊１４＊６，也就是这一层的输入．在这一层，使用的卷积核大小为５＊５＊６，输出深度为１６，不使用填充，步长设为１．因此输出矩阵的大小为：１４－５＋１＝１０．矩阵的大小为１０＊１０＊１６．
（第四层）：池化层
这一层的池化层的过滤器大小为２＊２，步长为２．因此大小为５＊５＊１６．
（第五层）：全连接层，设置节点数为１２０．
（第六层）：全连接层，设置节点为８４
（第七层）：全连接层，设置节点为１０
（第八层）：Softmax 层．用来把输出概率化处理．