最近,在进行相关中文文本识别的工作,查阅了许多论文。最终决定参考谷歌的基于注意力机制的街景文本识别的论文:"Attention-based Extraction of Structured Information from Street View Imagery",并对官方源代码进行修改。
本次中文文本识别的github地址为:https://github.com/A-bone1/Attention-ocr-Chinese-Version。代码使用的是python3.5及Tensorflow1.4,可在window10、ubuntu16.04上运行。下面对本次模型进行一个较为详细的描述。
一:模型整体框架及识别基本流程