OCR项目汇总

基本介绍

1 OCR文字识别用的是什么算法?|知乎
2 深度学习文字识别论文综述|CSDN, 综述中涉及到的论文都很旧,
3 文字检测与识别资源|CSDN,涉及的论文都很新,五颗星
4 Awesome Scene Text Recognition,awesome,五颗星
5 OCR, 这个博主的质量都很高,五颗星
6 YunOS场景文字识别|阿里云

paper

reading text in the wild, VGG 组
1 Reading Text in the Wild with Convolutional Neural Networks, VGG组,, IJCV2016
阅读笔记|CSDN
2 Synthetic Data for Text Localisation in Natural Images, VGG组, CVPR2016,
阅读笔记|CSDNcode
3 Deep Features for Text Spotting
, VGG组, ECCV2014
4 Detecting Text in Natural Image with
Connectionist Text Proposal Network
,
code, ECCV2016

CVPR2017相关paper

数据集

gtihub code

1 tesseract, stars 12k, C/C++接口
2 tesseract.js, stars 12k, pure js,支持62种语言的OCR
3 paperless, stars 3.6k, 主打document OCR
4 pyocr, starts 606, A Python wrapper for Tesseract and Cuneiform
5 doc2text, stars 1k, 依赖opencv与tesseract
6 pdftabextract, stars 668,pdf中的表格提取转换到excel中
7 tesserocr,tesseract-ocr API
的python 接口
8 SSD_scene_text_detection, 将SSD用于场景文本检测中

复现点:
1 paper: reading text in the wild with deep convolutional neural network
论文阅读笔记:论文阅读:Reading Text in the Wild with Convolutional Neural Networks,
部分代码为code|matlab

文章的主要思想为先利用region proposal产生出足够多的候选区域,再resize这些候选框到固定大小,用一个CNN来对这些候选框进行单词的分类,超过90k个单词。使用生成的带文本的图片的方法,能够保证文本单词的样本量。
思路很清晰,限制条件也很明显,不能出现样本外的单词,诸如一些合成词;此外,候选框也需要完整地包含单词。

2 paper : EAST: An Efficient and Accurate Scene Text Detector
旷视的最新成果。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值