自然场景下的文本识别——文本识别分类器详解

前言:

在上一篇文章中,我们简单讲解了文本识别分类器之卷积神经网络(CNN)分类器,在这篇文章中,将从 文本识别分类器的结构,文本识别分类器的输入,以及 文本识别模块的设计 三个方面讲述。

1.文本识别分类器的结构在这里插入图片描述

如上图所示,文本识别分类器由一个十层的卷积神经网络组成,其中包括一个输入层和一个输出层,中间八层分为四组,每一组由一个卷积层和一个Maxout激活函数层组成。Maxout激活函数有着如下的表达式:
在这里插入图片描述
其中Gk表示从输入集合G中顺序选取的k个元素,激活函数简单地取这k个元素函数值中的最大值。中间层的部分采用部分连接的方式,第一组卷积-激活层接收大小为32×32的图像,并采用大小为9的窗口卷积96个过滤器,激活函数的k值为2,因此其体积为24×2

  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值