文字检测与识别
文章平均质量分 89
主要介绍自然场景等文字检测与识别算法
PeaceInMind
兴趣方向:图像,控制算法
展开
-
[水水博文]多方向文本检测自研结果
有很多不好的地方。目前不提供任何细节,请见谅。此方法在icdar15上的结果已上传至[link]主要目的是希望能认识相关的朋友进入文字识别这个领域,特别是中文文字识别,希望能与大家多多交流,求大牛指导,因为身边主要就是我自己在瞎搞,进步比较慢 ...原创 2017-05-18 23:49:15 · 3177 阅读 · 18 评论 -
[论文复现]Detecting Text in Natural Image with Connectionist Text Proposal Network
最近一直在复现这篇论文,除了数据外已基本完成,可是没想到昨天开源了[code],不过作者不公开对于识别很重要的side refinement模块,算是一个阉割版,附上个人的一些中间结果(只训练了200多张图片,网络架构,参数等跟作者的有些出入),主要是这篇论文步骤比较简单,如果比较清楚RPN,基本没什么说的。论文的思想主要借鉴了faster rcnn的rpn思想,主要的不同点在于作者观测到...原创 2016-11-18 12:52:40 · 9550 阅读 · 31 评论 -
文字检测与识别资源
本文写成时主要参考了[1,2], 后面加了一些自己收集的,不过大家都在更新,所以区别不是很大。蓝色部分代表最近新增的部分综述自然场景文字检测自然场景文字识别数据集开源库其他手写字识别牌照等识别破解验证码参考[2015-PAMI-Overview]Text Detection and Recognition in Imagery: A Survey[...原创 2016-05-12 20:38:45 · 68885 阅读 · 27 评论 -
文字检测与识别1-MSER
导语文字识别在现实场景中的用途非常广泛,现在已经有很多公司将这项技术用于实际中。比如车牌识别,图片转换成文档,拍照搜题,拍照翻译等。这让很多人有了错觉,感觉文字识别的技术已经炉火纯青,可以广泛应用。其实不然,车牌识别里面字体和字的类型比较单一,并且有一些矩形等辅助的特征。而拍照翻译的图片一般是文档类型,较容易识别,但也有不小的错误率。文字识别的首要问题是找到文字,其次才是识别。而在自然场...原创 2015-11-19 20:10:00 · 29091 阅读 · 21 评论 -
文字检测与识别2-字符过滤
导语在上一章节中我们介绍了怎么在一幅图片中提取潜在的字符(character proposals)。一般情况下基本上都会发生两种不想要的情况。第一种就是有些字符没提取出来,称之为false negative,这个可以通过多通道(如梯度幅值或者其他颜色通道)提取MSER来减轻。另外一种是提取出来的字符有很多不是真的字符,称之为false positive,这个需要一些过滤算法来过滤.这一原创 2015-11-23 23:06:04 · 8620 阅读 · 6 评论 -
文字检测与识别3-字符合并
1导语前两节我们分别解释了字符提取和字符过滤,在这过程中主要有=两个原因需要我们将单个字符组合成一个文字行或者段落之类(如图1)。一个重要的原因是出来不管是由于MSER的原因还是分类器的原因,有些真的字符并没有找出来,比如i和j上面的点等等,当然实际中情况要远比这些严重的多,我们需要靠字符合并来恢复这些漏掉的字符。另外一个原因是在识别的时候有上下文会大大增加识别的精度,比如一个0,有时原创 2015-12-21 19:55:27 · 7266 阅读 · 0 评论 -
文字检测与识别4-过分割和beam search
前面的章节已经介绍了提取文本行的方法。本文主要介绍传统的依赖over segmentation过分割,beam search和字符分类器的识别方法。主要参考文献[1]和opencv contribute中text module中的代码[5]。一般情况下我们会通过二值化,投影、连通域分割,分类器判别这套程序来做文字识别,但是一方面二值化现在还没有一统江湖的方法,另一方面就算某些情况下二值化做原创 2016-05-08 21:05:32 · 7149 阅读 · 1 评论 -
文字检测和识别5-LSTM简介
导语LSTM[1]作为RNN的经典模型,已经应用在了很多领域,如语音识别[2],OCR[3][4],图像描述[5],手写字识别[6],翻译[7],自然语言处理等等。在线手写字识别[11]图像内容描述[5] 1为什么需要LSTM 1.1时序问题如果接到一个时序问题时,比如语音识别,我首先会想着先切割,然后每一段每一段地去识别,但是原创 2016-03-10 17:13:33 · 13899 阅读 · 0 评论 -
FASText(上) : Fast 角点
0 导语本文主要介绍论文FASText:Efficient Unconstrained Scene Text Detector[pdf][code],其核心思想是定制化fast角点使其更有利于场景文字的检测。因此本文主要分上下两篇,第一篇先介绍fast角点,并剖析其opencv(2.4.10)的代码,下篇再介绍FSAText.首先我们直观感受下FASText和Fast角点,参数原创 2016-07-14 17:07:30 · 5795 阅读 · 6 评论 -
FASText(下):FASText
0导语上一篇我们已经大致介绍了FAST角点,原始的FAST能处理一些带角点的的字母如L,P,但是很难处理o,和8等情况。以o为例,见下图,像素值会被截成四个部分,这样的话就很难满足原始的Fast角点需要连续多个点都要亮或暗的要求。另外由于Fast角点不是专门为定位文本设计,因此也会有很多的false postives.基于这些观察,FASText作者在Fast角点的基础上定制了两种角点SEK(...原创 2016-07-22 19:32:04 · 3906 阅读 · 16 评论