1 为什么使用CNN
1.1ANN缺点:
1.2 CNN使用什么方法解决:
2卷积神经网络
2.1特点:利用特征做学习,不以单个像素作为输入,而是以特征作为输入。
2 .2架构
3 算法步骤
3.1步骤一:图片编码为矩阵
3.2步骤二: 利用过滤器,进行卷积运算,提取特征
3.2.1 模型实例与定义:过滤器是自己挑选的特征;不同的过滤器(科学家给你找好了)可以提取图片不同的特征;通过深度学习算法可以学习得出参数W从而得到一个直接训练的过滤器,可以用于检测你想检测出来的图片特征。
3.2.1.1经过不同的特征提取器,图片会变成不一样。
使软件:GIMP,可以用来查看使用特征提取器进行原图卷积运算后的输出图片。
3.2.2参数一:过滤器大小
一般都是奇数(33-55-7*7),原因:
1、采用same填充策略时,才有自然向图片四周填充,不会左边一点,右边一点;
2、过滤器有中心点,容易计算位置。
3.2.3参数二:过滤器移动步幅
自己设定的,参考别人的
1、如果不是整数就进行地板除法(向下取整数)
2、过滤器移步到图像外就不计算了
3.2.4参数三:填补(padding)
使用原因:
1、为了适应神经网络训练需求,使得图片的输入和输出大小一致性;
2、防止边缘信息被忽略。
两种策略:
3.2.5 利用以上三个参数计算输入图片大小经卷积后输出大小
3.2.6三维条件下卷积同理
根据需求,设置多个三维过滤器,再将过滤之后的输出堆叠在一起,堆叠意味着提取图片特征的总和。
随着卷积运算,图像的宽高会减少,特征通道会增加
标记的常用形式:
3.3步骤三:对卷积运算后的图片加入偏差量并激活。
激活目的:抑制掉不想要的输入,突出想要的。
例子:
3.4 步骤四:池化(pooling)(静态属性层):
3.4.1参数(都是人为设置,所以它没有要求的参数)
参数1:过滤器的尺寸大小( f=2,s=2;f=3,s=2常用,表示高和宽减少一半)
参数2:移动步长
参数3:很少这是padding参数
3.4.2策略
最大化方法和取平均方法(最大化比较常用)
作用:如何从不同角度辨识出一个物体:找出代表性特征
图片变成矩阵后,如何保留重要特征,去辨认图片内容
3.4.3 模型图
注意:这里的运算方法与卷积运算完全不同,卷积三运算在维条件下是单个通道逐个运算,然后将三个通道的计算值加和在一起输出一个值,输入单个通道的图片,经过一个过滤器变成一张图片了;
这里是几个通道就输出几个通道的图片,一一对应的。
3.5步骤五 展开输出
假设池化后输出如下图:
目的:转化成向量输入形式,准备构建全连接网络了
3.6 步骤六: 构建全连接网络层
4、一些说明
4.1关于卷积层的定义
也有这种提取多张不同的特征图,全部特征图的集合称之为卷积层。
如果还有疑惑,可以看看这篇文章,总结的特别好,强烈推荐!!
https://www.cnblogs.com/wj-1314/p/9754072.html
参考自吴恩达课程及其他博客,学习记录,如有侵权,马上删除。