OCR文字识别(2)

本文深入探讨了OCR(光学字符识别)技术,重点介绍了Attention OCR模型,这是一种利用注意力机制来提高文字识别准确性的方法。文章详细阐述了文字识别的多种方法,包括基于分割的分类、序列CNN和one step检测-识别。特别是,Attention OCR通过加入注意力层,增强了文字位置的定位能力。还提供了代码解析和汉字识别的应用步骤,包括构建中文词典和训练过程中的标签映射。最后,文章预告将进一步讨论算法改进。
摘要由CSDN通过智能技术生成

一. 文字识别

       文字识别是指在确定检测框之后,识别出对应的文字,文字识别的方法有很多,包括:

1)基于分割后单个字符的分类;

2)基于序列的CNN方法,包括 基于STN矫正,CTC loss,Attention机制等策略;

3)基于one step的检测-识别方法,比如fots、Radical Analysis Network;

二. Attention Model

       文字的有效定位对于检测是非常重要的,确定文字的有效区域有利于对文字进行准确切分,提高准确度,Attention Model是一种非常有效的策略,这项工作来自于google,实验效果非常不错。

       论文:Attention-based Extraction of Structured Information from Street View Imagery

       Github:https://github.com/tensorflow/models/tree/master/research/attention_ocr

       Attention OCR结构示意:

   

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值