卷积神经网络
卷积神经网络(Convolutional Neural Network,CNN)是一种深度学习神经网络,特别适用于处理和分析具有网格结构数据的任务,如图像和视频。
- 1.从全连接层到卷积
- 2.图像卷积
- 3.填充和步幅
- 4.多输入多输出通道
- 5.汇聚层
- 6.LeNet模型
图像都是由一个二维像素网格组成,每个像素可能是一个或者多个数值,取决于黑白还是彩色图像。目前为止,我们仅仅通过将图像数据展平成一维向量而忽略了每个图像的空间结构信息,再将数据送入一个全连接的多层感知机中。因为这些网络特征元素的顺序是不变的,因此最优的结果是利用先验知识,即利用相近像素之间的相互相关联性,从图像数据中学习到有效的模型。
卷积神经网络是一类强大的,为处理图像数据而设计的神经网络。
图像识别,目标检测
卷积网络主干基本元素:
卷积层本身:
填充:
步幅:的基本细节,用于在相邻区域汇集信息的
输入输出通道:
汇聚层:用于在相邻区域汇集信息的
LeNet模型:
1.从全连接层到卷积
多层感知机十分适合处理表格数据,其中行对应样本,列对应特征。表格数据我们找的模式可能设计特征之间的交互,但是我们不能预先假设任何与特征交互相关的先验结构,这种情况下多层感知机可能是最好的选择,然而对于高维感知数据,这种缺少结构的网络可能会变得不实用。
识别猫狗是机器学习中利用图像中已知结构的创造性方法。
1.1不变性
卷积神经网络正是将空间不变性的这一概念系统化,从而基于这个模型使用较少的参数来学习有用的表示。
1.2多层感知机的限制
1.2.1平移不变性
1.2.2局部性
1.3卷积
1.4通道
1.5结论
- 图像的平移不变性使我们以相同的方式处理局部图像,而不在乎它的位置。
- 局部性意味着计算相应的隐藏表示只需一小部分局部图像像素。
- 在图像处理中,卷积层通常比全连接层需要更少的参数,但依旧获得高效用的模型。
- 卷积神经网络(CNN)是一类特殊的神经网络,它可以包含多个卷积层。
- 多个输入和输出通道使模型在每个空间位置可以获取图像的多方面特征。
2.图像卷积
卷积层(Convolutional Layer):卷积神经网络使用卷积层来提取输入数据的特征。卷积操作允许网络识别图像中的边缘、纹理和其他局部特征。通过卷积核(也称为滤波器),网络可以在不同位置对输入数据进行局部感知,从而实现平移不变性。