文章目录
一、CRNN(卷积递归神经网络)
1.1 CRNN介绍与网络结构
CRNN模型,即将CNN与RNN网络结合,共同训练。主要用于在一定程度上实现端到端(end-to-end)地对不定长的文本序列进行识别,不用先对单个文字进行切割,而是将文本识别转化为时序依赖的序列学习问题,就是基于图像的序列识别。(说一定程度是因为虽然输入图像不需要精确给出每个字符的位置信息,但实际上还是需要对原始的图像进行前期的裁切工作)
① 构建CRNN输入特征序列;
② 其中还涉及到了CTC模块,目的是对其输入输出结果
1.1.1 网络结构
CRNN的网络结构包括三个组成部分:卷积层、循环层和转录层。
1.CNN(卷积层):使用深度CNN,对输入图像提取特征,得到特征图;
2.RNN(循环层):使用双向RNN(BLSTM)对特征序列进