文本检测与识别
xz1308579340
这个作者很懒,什么都没留下…
展开
-
文本检测-Psenet
通常OCR中,文字检测都是由目标检测继承而来,目标检测大多都是基于先验框的(anchor base),近期出现的no-anchor模式本质上也是基于先验框的。anchor-base模式在目标检测衍生到OCR领域就有很多缺陷,比如:倾斜(或扭曲)文字检测不准、过长文字串检测不全、过短文字串容易遗漏、距离较近的无法分开等缺点。近期,渐进式扩展网络(PSENet)横空出世,以另一种思路解决了这些问题。目前文本检测领域主要有两种方法,一种是Anchor-based的方法,如下(b)所示,其主要问题是基于ancho原创 2020-07-10 19:56:58 · 1616 阅读 · 0 评论 -
EAST算法(Efficient and Accuracy Scene Text))
1.EAST模型简介本文介绍的文本检测模型EAST,便简化了中间的过程步骤,直接实现端到端文本检测,优雅简洁,检测的准确性和速度都有了进一步的提升。如下图:其中,(a)、(b)、(c)、(d)是几种常见的文本检测过程,典型的检测过程包括候选框提取、候选框过滤、bouding box回归、候选框合并等阶段,中间过程比较冗长。而(e)即是本文介绍的EAST模型检测过程,从上图可看出,其过程简化为只有FCN阶段(全卷积网络)、NMS阶段(非极大抑制),中间过程大大缩减,而且输出结果支持文本行、单词的多个角度原创 2020-06-12 19:08:22 · 8119 阅读 · 0 评论 -
文本检测 DB:Real-time Scene Text Detection with Differentiable Binarization
原文地址:https://blog.csdn.net/m_buddy/article/details/103285989代码地址:DB-official:https://github.com/MhLiao/DBDBNet.pytorch:https://github.com/WenmuZhou/DBNet.pytorch1. 概述由于分割网络的结果可以准确描述诸如扭曲文本的场景,因而基于分割的自然场景文本检测方法变得流行起来。基于分割的方法其中关键的步骤是其后处理部分,这步中将分割的结果转换为文本原创 2020-06-05 23:47:48 · 6824 阅读 · 8 评论 -
CRAFT(Character Region Awareness for Text Detection)
相关资料论文地址:Character Region Awareness for Text Detection作者的推理部分代码:clovaai/CRAFT-pytorchhttps://zhuanlan.zhihu.com/p/76528329字符级文本检测CRAFT这个方法来源于CVPR2019 Character Region Awareness for Text Detection的论文,论文地址:https://arxiv.org/pdf/1904.01941.pdf已经开源的代码:ht原创 2020-05-29 21:55:11 · 1586 阅读 · 1 评论 -
What Is Wrong With Scene Text Recognition Model Comparisons? Dataset and Model Analysis
摘要分析了现有论文提到的各个数据集的不一致性。取(Feat),序列模块(Seq),预测(Pred)该框架不仅提供了现有的方法,而且还提供了它们可能的变体,以便对模块方面的贡献进行广泛的分析。通过这项研究,我们更加严格地评估了各个模块的贡献,并提出了以前被忽视的模块组合,从而改进了现有的技术水平。此外,我们还分析了基准数据集上的失败案例,以确定STR中的剩余挑战。统一训练集与测试集MJSynth(MJ)含有8.9百万的croped文本图片,主要特点如下:不同的字体渲染边框和阴影渲染背景着原创 2020-05-29 20:44:47 · 1341 阅读 · 0 评论 -
文本检测算法CTPN
OCR的第一步是文本检测,首先要定位文字的位置,即文字检测,CTPN是文本检测领域经典算法。论文地址:https://arxiv.org/abs/1609.03605CTPN是在ECCV 2016提出的一种文字检测算法。CTPN结合CNN与LSTM深度网络,能有效的检测出复杂场景的横向分布的文字,效果如图1,是目前比较好的文字检测算法。由于CTPN是从Faster RCNN改进而来,本文默认读...原创 2020-04-17 21:15:55 · 3095 阅读 · 0 评论 -
CRNN代码解析
CRNN主要分为三步1.特征提取2.序列转换3.执行LSTM获取序列输出4.进行CTC转换CRNN使用以下代码有三个作用1.特征提取2.序列转换3.执行LSTM获取序列输出 def inference(self, inputdata, name, reuse=False): """ Main routine to construct the...原创 2019-05-22 15:23:03 · 4174 阅读 · 3 评论 -
TextBoxes++论文阅读笔记
TextBoxes++论文阅读笔记@(生活感悟)[text detection, TextBoxes++, Markdown]TextBoxes++论文阅读笔记摘要主要贡献相关工作网络网络结构多偏置的default boxes各种框表示方法的转换方式卷积层的改变训练中的特殊处理1.如何表示ground truth2.loss functon3.On-li...原创 2018-03-30 16:47:56 · 6111 阅读 · 2 评论 -
ASTER: An Attentional Scene Text Recognizer
文章目录总结0.摘要1.介绍1.1主要贡献2.相关工作2.1文字识别2.2文字矫正 Text Rectification2.32.3 Text Detection and End-to-End Recognition3.模型3.1Rectification Network(纠正网络)31.1Localization Network3.1.2 Grid Generator3.1.3采样3.1.4ST...原创 2019-05-20 23:46:55 · 4259 阅读 · 2 评论