场景文字识别
OCR, STR.
Liu, Xu
www.liuxu0720.top
展开
-
【停更公告】
因为感觉CSDN的交流学习生态不是特别好,所以博客基本不怎么用了,平时的话知乎会看的多一点,后续有精力会写一些文章。个人目前在商汤实习,浙大计院硕士在读,方向是OCR(主要是场景文字识别)和 NAS,后续有希望交流或者需要内推的可以在知乎 (https://www.zhihu.com/people/francisliu-48)私信我。...原创 2020-05-31 14:30:03 · 657 阅读 · 2 评论 -
基于STN的场景文字识别框架整理
当前场景文字识别较为主流的方法分为 attention mechanism(代表:Show, Attend and Read; Transformer-based attention; 各种各样的 2D Attention) 和 STN + CRNN /DenseNet + CTC,二者的主要区别是一个是在解码前给文字区域赋予较高的权重,聚焦于文本信息,弱化无关背景信息,另一个是在一开始修正曲形...原创 2019-12-02 19:43:42 · 3270 阅读 · 2 评论 -
2D Attention Network for Scene Text Recognition
paper地址:2D Attentional Irregular Scene Text Recognizer.继 Transformer-based-OCR 后又一篇基于语言、翻译模型架构的不规则文字识别的paper,主要贡献如下:attention部分使用多层双向transformer的block(BERT)替代了单transformer block; label只用于计算loss,不...原创 2019-07-18 18:17:14 · 3147 阅读 · 4 评论 -
曲形文字识别 - Transformer-based Convolutional-Attention Network for Irregular Text Recognition
和上一篇基于attention机制的不规则文字识别论文是同一批作者,博客链接:Show, Attend and Read由于show attend and read是基于LSTM-encoder-decoder结构的翻译翻译模型(以前翻译的主流框架),隔壁翻译组的同事当时看到就说说不定可以用transformer(现在的主流翻译模型)做ocr,结果。。过了两三个月就真出了基于transfor...原创 2019-06-01 17:24:52 · 5860 阅读 · 12 评论 -
不规则文字识别方法之 SAR: Show, Attend and Read (2018)论文解析
论文地址:Show, Attend and Read: A Simple and Strong Baseline for Irregular Text Recognition对于不规则(曲形文字、艺术字等)的识别,作者没有采用基于修正(rectification)的策略,而是提出利用基于不规则文字而构造的(tailored)基于二维注意力机制模块(2D attention module)的模型...原创 2019-03-16 11:18:29 · 7677 阅读 · 23 评论 -
OCR-文本图像合成工具
1. Text Recognition Data GeneratorGithub地址:https://github.com/Belval/TextRecognitionDataGenerator官方文档:https://textrecognitiondatagenerator.readthedocs.io/en/latest/index.html安装:# pip 安装,中文不建...原创 2019-09-29 14:23:18 · 3105 阅读 · 1 评论