卷积神经网络的输入首先通过卷积层获取字符图像的局部特征,通过池化层赛选特征,然后将所有特征转换为一维特征向量,最终通过若干个全连接层完成分类
1.卷积神经网络与传统网络的区别:卷积神经网络直接对图像进行操作,不需要先把图像转化为像素点。
2.整体架构
2.1输入层
2.2卷积层(提取特征)
因为每一部分的特征需求是不一样的,因此需要对输入数据进行分割为多个小区域,把32*32*3的图像,分割为多个5*5*3的图像,经过卷积操作每个小区域的特征图(绿色图)
2.2.1图像颜色通道
对B、G、R分别单独做卷积运算,之后把卷积完的特征图结果加在一起就得到了卷积层的结果
特征图个数:一个图像因卷积核f的不同,可以有多个特征图
堆叠的卷积层。我们在上一层卷积出的特征图的结果上再次卷积
卷积层涉及的参数:滑动窗口步长,卷积核尺寸,边缘填充,卷积核个数
步长越小,提取的特征越丰富,效率较低,常用的步长为1
卷积核尺寸。3*3卷积核(常用),4*4卷积核,5*5卷积核等
边缘填充。在对图像进行卷积操作的时候,边界上的点相对于中间的点其发挥作用的次数要少很多,边界填充能够一定程度上弥补了边界信息缺失的问题,使边界上的像素点利用率增高,使卷积网络能够更公平的对待边界上的特征。
卷积核个数。卷积核个数=特征图的个数
2.2.2特征图尺寸计算与参数共享
卷积结果的长度:,卷积结果的宽度
其中W1,H1表示输入的宽度、长度;W2,H2表示输出特征图的宽度、长度;F表示卷积核的长和宽的大小;S表示滑动窗口的步长;P表示边界填充(加几圈0)。
参数共享:同一个filter对图像中的每一个位置都是采用相同的卷积核
2.3池化层(下采样,压缩特征),在得到的原始特征图上进行筛选
2.4全连接层(主要作用是进行特征的分类。经过池化层操作后得到的特征图为32*32*10,为了进行特征匹配任务需要把32*32*10的特征结果,转化成二维向量,二维向量的大小为(1024,5)32*32*10=1024数字相乘,其中5为需要分类的5个类别,因此在池化层和全连接层之间需要有一个拉长的动作,使其转化为二维向量)
特征图的变化如下: