文章目录
CTPN论文下载:https://arxiv.org/pdf/1609.03605.pdf
一、OCR简介
文字识别也是图像领域一个常见问题。然而,对于自然场景图像,首先要定位图像中的文字位置,然后才能进行文字的识别。
所以一般来说,从自然场景图片中进行文字识别,需要包括2个步骤:
-
文字检测(CTPN):解决的问题是哪里有文字,文字的范围有多少
-
文字识别(CRNN):对定位好的文字区域进行识别,主要解决的问题是每个文字是什么,将图像中的文字区域进转化为字符信息。
OCR的作用:提取图像中的文字,并转换成文本形式,供后续NLP任务使用。
二、CTPN(Connectionist Text Proposal Network)连接文本提议网络
2.1 CTPN简介
文本检测本质上也属于物体检测,但是文本却