使用 tensorflow 构建神经网络,识别图片中的文字。
前言
基于图像的序列识别一直是计算机视觉中长期存在的研究课题。在本文中,我们研究了场景文本识别的问题,这是基于图像的序列识别中最重要和最具挑战性的任务之一。提出了一种将特征提取,序列建模和转录整合到统一框架中的新型神经网络架构。与以前的场景文本识别系统相比,所提出的架构具有四个不同的特性:
与大多数现有的组件需要单独训练和协调的算法相比,它是端对端训练的。
它自然地处理任意长度的序列,不涉及字符分割或水平尺度归一化。
它不仅限于任何预定义的词汇,并且在无词典和基于词典的场景文本识别任务中都取得了显著的表现。
</