卷积神经网络CNN——原理篇

参考文章:卷积层与池化层机器视角:长文揭秘图像处理和卷积神经网络架构

一、卷积层

1、什么是卷积?卷积的基本原理

每张图像对应一个特征矩阵,卷积核3*3也是一个矩阵。(卷积核:奇数方阵)

图像矩阵中按顺序(从左到右、从上到下)获得3*3的小矩阵,与卷积核(权值矩阵,过滤器)的对应元素分别相乘,得到9个数,相加,得到一个数。

重复以上步骤,直到图像矩阵的全部元素遍历完。

得到的数,按顺序构成新矩阵。             →“激活映射”→激活图

图1 卷积层工作原理

2、步长(stride):卷积核移动的距离

图1的步长为1,图像规模变小。(步长增加,图像规模变小)

为使得卷积后的激活映射尺寸不变,可以在数据的外层补0(边界padding)(不止一层)

图2 数据四周补0(padding)

3、大多数情况下,不用单一卷积核,而是用维度相同的多个卷积核,输出堆叠,形成图像的纵深维度

(不同卷积核,可以提取到不同的边界特征→不同物体→目标检测)

 

二、池化层

1、唯一目的:减少图片的空间大小

(在随后的卷积层之间,周期性地引入池化层)

2、常见形式:最大池化(提取最明显特征)、平均池化(将所有像素值相加,再平均)、L2规范池化

池化实例

3、图像的纵深,保持不变

三、输出层

1、输出层的深度,等于卷积核数量

2、卷积

输出尺寸(长、宽):(W-F+2P)/S+1

W是输入尺寸,F是卷积核尺寸,P是填充数量,S是步长

如:输入图像为32*32*3,卷积核为5*5*3,10个,零填充,单步长。计算得,输出为28*28*10

3、池化

W=W➗kernel_size(按照原理应该是这样子的,但是网上的计算公式又不是··)

 

四、pooling选择

1、如卷积核为3时 padding 选择1

2、如卷积核为5时 padding 选择2

3、如卷积核为7时 padding 选择3

 

实战:pytorch+CNN经典模型→mnist识别

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值