Task3-字符识别模型(卷积神经网络)

本文介绍了卷积神经网络的基础,包括卷积层和池化层的作用,以及RestNet如何通过恒等映射解决深度网络的退化问题。此外,还详细阐述了CRNN模型在文字识别中的应用,强调其特征提取、序列建模和转录层的功能。
摘要由CSDN通过智能技术生成

Task3-字符识别模型(卷积神经网络)

1 卷积神经网络原理

定义

  • 卷积神经网络由一个或多个卷积层、池化层以及全连接层等组成。与其他深度学习结构相比,卷积神经网络在图像等方面能够给出更好的结果。这一模型也可以使用反向传播算法进行训练。相比较其他浅层或深度神经网络,卷积神经网络需要考量的参数更少,使之成为一种颇具吸引力的深度学习结构。

其中主要包含了几个主要的结构:

  • 卷积层(Convolutions)
  • 池化层(subsampling)
  • 全连接层(Full connection)
  • 激活函数

1.1 卷积层

  • 目的

    • 卷积运算的目的是提取输入的不同特征,某些卷积层可能只能提取一些低级的特征如边缘、线条和角等层级,更多层的网路能从低级特征中迭代提取更复杂的特征。**(提取特征,检测边缘,降维)*
  • 参数:

    • size: 卷积核的大小
    • padding:零填充(对边缘填充),valid与same
    • stride:步长,通常是1
  • 计算公式:

    • 图片的体积:(H1&
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值