【AI实战】超赞的几个OCR开源项目

94 篇文章 10 订阅
1 篇文章 0 订阅

OCR

OCR(optical character recognition)文字识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程。
点击查看百科:OCR文字识别 介绍

历史背景

光学文字识别的概念是在1929年由德国科学家Tausheck最先提出来的,后来美国科学家Handel也提出了利用技术对文字进行识别的想法。而最早对印刷体汉字识别进行研究的是IBM公司的Casey和Nagy,1966年他们发表了第一篇关于汉字识别的文章,采用了模板匹配法识别了1000个印刷体汉字。

20世纪70年代初,日本的学者开始研究汉字识别,并做了大量的工作。

1986年以后我国的OCR研究有了很大进展,在汉字建模和识别方法上都有所创新,在系统研制和开发应用中都取得了丰硕的成果,不少单位相继推出了中文OCR产品。

早期的OCR软件结构

1、图像输入、预处理

2、二值化

3、噪声去除

4、倾斜较正

5、版面分析

6、字符切割

7、字符识别

8、版面恢复

9、后处理、校对

超赞的几个OCR开源项目介绍

  • 第三名:chineseocr

    • 本项目基于yolo3 与crnn 实现中文自然场景文字检测及识别

    • 该项目提供了数据集
      ocr ctc训练数据集(压缩包解码:chineseocr)
      百度网盘地址:链接: https://pan.baidu.com/s/1UcUKUUELLwdM29zfbztzdw 提取码: atwn

    • 实现功能
      文字方向检测 0、90、180、270度检测(支持dnn/tensorflow)
      支持(darknet/opencv dnn /keras)文字检测,支持darknet/keras训练
      不定长OCR训练(英文、中英文) crnn\dense ocr 识别及训练 ,新增pytorch转keras模型代码(tools/pytorch_to_keras.py)

    • 其他说明:
      https://github.com/chineseocr/chineseocr#readme

  • 第四名:YCG09/chinese_ocr

    • 基于Tensorflow和Keras实现端到端的不定长中文字符检测和识别

      文本检测:CTPN
      文本识别:DenseNet + CTC

    • 该项目提供了数据集:
      https://pan.baidu.com/s/1QkI7kjah8SPHwOQ40rS1Pw (密码:lu7m)

      共约364万张图片,按照99:1划分成训练集和验证集
      数据利用中文语料库(新闻 + 文言文),通过字体、大小、灰度、模糊、透视、拉伸等变化随机生成
      包含汉字、英文字母、数字和标点共5990个字符
      每个样本固定10个字符,字符随机截取自语料库中的句子
      图片分辨率统一为280x32

其他开源项目

https://github.com/eragonruan/text-detection-ctpn

https://github.com/senlinuc/caffe_ocr

https://github.com/chineseocr/chinese-ocr

https://github.com/xiaomaxiao/keras_ocr

https://github.com/alisen39/TrWebOCR

https://github.com/da03/Attention-OCR

https://github.com/JinpengLI/deep_ocr

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

szZack

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值