[深度学习]场景文字检测与识别

本文探讨了自然场景文字检测的重要性,定义了文字检测问题,并列举了多种挑战。文章介绍了Holistic, Multi-Channel Prediction, TextBoxes, TextSnake等前沿算法,以及EAST、CRNN等简化流程的方法,深入讲解了这些方法如何应对文字检测的复杂性和多样性。此外,还提到了文字识别的相关技术如ASTER和FAN,并推荐了相关的资源和研究。" 135513547,15115704,低轨卫星通信:异质终端协同资源调度新方法,"['网络', '算法', '通信技术', '卫星通信', '资源管理']
摘要由CSDN通过智能技术生成

目录

背景

文字为什么重要?

问题定义

那么会有那些挑战呢?

近期前沿和有代表性算法

Holistic, Multi-Channel Prediction

TextBoxes

Rotation Proposals

Corner Localization and Region Segmentation(A Megvii work in CVPR 2018)

Simpler Pipelines

EAST (A Megvii work in CVPR 2017)

任意形状的文字检测

TextSnake (A Megvii work in ECCV 2018)

Mask TextSpotter (A Megvii work in ECCV 2018)

文字识别

CRNN

ASTER

FAN

资源推荐


背景

文字为什么重要?

因为人类创造了文字,它具有两种特点:

  1. 具有丰富和精确的高层语义信息
  2. 传达了人类的思想和感情

同时文字在自然场景中可以作为一种视觉线索,具有互补的作用,比如边缘,纹理等等。

问题定义

文字检测是指通过算法判断文字的位置以及检测字符的过程。

那么会有那些挑战呢?

与传统的OCR不同,

自然场景更杂乱,OCR 更规整

文字类型千变万化,格式,颜色等

具体的挑战分为三类:

  1. 不同的大小,语言,格式等
  2. 背景中的干扰,符号,交通信号灯等结构具有局部相似性
  3. 成像过程,噪声模糊遮挡阴影等等。

近期前沿和有代表性算法

有一些算法从目标检测和语义分割中得到灵感启发:

Holistic, Multi-Channel Prediction

Yao et al.. Scene Text Detection via Holistic, Multi-Channel Prediction. 2016. arXiv preprint arXiv:1606.09002

  • lholistic vs. local
  • ltext detection is casted as a semantic segmentation problem
  • lconceptionally and functionally different from previous sliding-window or connected component based approaches
  •  
  • lholistic, pixel-wise predictions: text region map, character map and linking orientation map
  • ldetections are formed using these three maps
  • lcan simultaneously handle horizontal, multi-oriented and curved text in real-world natural images

TextBoxes

Liao et al.. TextBoxes: A Fast Text Detector with a Single Deep Neural Network. AAAI, 2017.

 

  • la text detection
  • 1
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值