Convolution-CNN卷积

椰子奶糖

已于 2023-06-29 15:02:29 修改

阅读量726

点赞数 1

分类专栏： # 机器学习理论杂记文章标签： cnn 深度学习神经网络

于 2021-06-08 23:45:15 首次发布

本文链接：https://blog.csdn.net/symuamua/article/details/117718643

版权

18 篇文章 0 订阅

订阅专栏

可以看到，对于一张图片，CNN首先要做的事Conv（卷积）+Max Pooling（池化），用以提取特征，然后经过Flatten之后扔到FC（全链接）里面做分类。

首先解释下几个属性：
- kernel=卷积核
- Filter = 卷积核的厚度（维度，也就是说对于一个kernel，他有很多Filter（且当input image是个维度是三维如RGB三维的时候，每个Filter就有三层）组成，每个Filter都是mxnxl（其中l表示纵向维度，mn为平面的矩阵的行和列）的矩阵，然后这个Filter算的时候呢，就是一个个算过去（假如有多个的话，当然在GPU里面是并行的））
- stride = 卷积核移动的步数，一般来说卷积核是从左往右移动，stride=n则每次移动n格
- padding，表示四周不全，就是在input四周补上像素点，padding=n则补上n层
看上图，这层Filter的卷积核要做的是提取对角全1的特征，对比输入可以看到，有对角全1特征的部分分别是左上角左下角，而在Feature Map（中的一层）中左上左下刚好是3，该位置有这个特征（这里感觉有点特征检测的作用，同时还做了特征定位？）
然后这里还有个小点：根据input+kernel算feature的大小，其中input、kernel表示input、kernel的尺寸，得出Feature Map尺寸为：
- $Feature\_Map = (\frac{input-kernel+1+2*padding}{stride})$

这个概念在李老师的课里听到，耳目一新！当我们将6x6的image（我们假设是一维的不是RGB三维）完全展开的时候（1-36的input），我们卷积的每个filter就是一个weight矩阵！然后卷积出来的每层Feature都是output，也是下一层的input，这俩通过Filter中的参数链接起来（这个参数就相当于w了）！

关注