卷积神经网络CNN——原理篇

最新推荐文章于 2024-07-12 11:45:29 发布

会飞的咩咩

最新推荐文章于 2024-07-12 11:45:29 发布

阅读量421

点赞数 1

参考文章：卷积层与池化层、机器视角：长文揭秘图像处理和卷积神经网络架构

一、卷积层

1、什么是卷积？卷积的基本原理

每张图像对应一个特征矩阵，卷积核3*3也是一个矩阵。（卷积核：奇数方阵）

图像矩阵中按顺序（从左到右、从上到下）获得3*3的小矩阵，与卷积核（权值矩阵，过滤器）的对应元素分别相乘，得到9个数，相加，得到一个数。

重复以上步骤，直到图像矩阵的全部元素遍历完。

得到的数，按顺序构成新矩阵。 →“激活映射”→激活图

图1 卷积层工作原理

2、步长（stride）：卷积核移动的距离

图1的步长为1，图像规模变小。（步长增加，图像规模变小）

为使得卷积后的激活映射尺寸不变，可以在数据的外层补0（边界padding）（不止一层）

图2 数据四周补0（padding）

3、大多数情况下，不用单一卷积核，而是用维度相同的多个卷积核，输出堆叠，形成图像的纵深维度

（不同卷积核，可以提取到不同的边界特征→不同物体→目标检测）

二、池化层

1、唯一目的：减少图片的空间大小

（在随后的卷积层之间，周期性地引入池化层）

2、常见形式：最大池化（提取最明显特征）、平均池化（将所有像素值相加，再平均）、L2规范池化

池化实例

3、图像的纵深，保持不变

三、输出层

1、输出层的深度，等于卷积核数量

2、卷积

输出尺寸（长、宽）：（W-F+2P）/S+1

W是输入尺寸，F是卷积核尺寸，P是填充数量，S是步长

如：输入图像为32*32*3，卷积核为5*5*3，10个，零填充，单步长。计算得，输出为28*28*10

3、池化

W=W➗kernel_size（按照原理应该是这样子的，但是网上的计算公式又不是··）

四、pooling选择

1、如卷积核为3时 padding 选择1

2、如卷积核为5时 padding 选择2

3、如卷积核为7时 padding 选择3

实战：pytorch+CNN经典模型→mnist识别

会飞的咩咩

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。