基于神经网络的蒙文手写字母识别的一些研究(卷积神经网络)

本文介绍了使用卷积神经网络(CNN)进行手写蒙古字母识别的研究,详细阐述了CNN的基本结构,包括输入层、卷积层、池化层及其优势。并展示了如何构建CNN模型,包括参数定义、卷积核的选择和池化操作,旨在通过实例帮助读者理解和掌握CNN技术。
摘要由CSDN通过智能技术生成

基于神经网络的手写蒙古字母识别(一)

各位博友大家好!我是PennyWu,让大家久等了,我们继续学习。

1. 卷积神经网络(Convolutional Neural Network,CNN)

1.1 卷积神经网络CNN

首先必须肯定的是CNN是一个多层神经网络结构,其次它有以下几大特点:

1.具有较强的容错性。(CNN拥有最具代表性的卷积层和池化层)

2.具有较强的自学习能力和并行处理能力。(CNN是一种前馈神经网络)

3.局部联接和权值共享(最大特点)

基于上述特点,CNN在图像识别中的地位就很突出了。这项技术也相对成熟,因此数据集也对应做成图像,从而进行图像识别及手写蒙古字母识别。

1.2 CNN基本结构

卷积神经网络最为基本的结构,依次是输入层、卷积层、池化层

1.3 输入层

输入层,也就是输入图像层,输入层的图像的尺寸最好是2的整数倍且能被2整除很多次,这样设定是为了便于计算机对图像进行处理。典型数据集的输入层有以下几种,如表1所示。

                       表1 输入层典型数据集

数据集

输入尺寸

MNIST数据集

28*28

DBRHD数据集

32*32

CIFAR-10

32*32

STL-10

96*96

1.4 卷积层

卷积层一般情况下使用小尺寸的滤波器。如果滤波器大小不一致,一般将大尺寸的用在第一个处理输入图像的卷积层上。滤波器的尺寸大小一般用3*3或5*5的居多。为了不改变输入数据在空间维度上的尺寸以及保留更多的有效数据,一般情况下将步长S设为1,对输入数据进行零填充。填充的大小P=(F-1)/2,其中F为过滤器尺寸,这样就能保证图像的尺寸不改变。卷积的过程,如图1所示。

1

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值