CRNN:目前常用的字符识别模型 但在实践过程中发现 该模型无论在训练还是测试上效果都不够优秀 说明OCR领域还有许多需要研究的地方 CRNN模型也有许多可改进之处
简单来说,模型的结构就是一个卷积网络+双向lstm+全连接层进行分类+ctc解码识别
卷积将一个大小为32*100的原图转化为了1*25大小的特征图,然后送进lstm
主要进行了三次训练,分别是基于中文诗句数据集、英文数据集、中英文混合数据集
训练时的一个问题时训练速度极慢 同事们说是lstm的问题 这个我就不太懂了 先到这儿 以后再记