【文本检测】必读论文合集推荐丨定向场景文本检测、多方向文本检测等

AMiner学术搜索和科技情报挖掘

于 2022-05-16 17:24:13 发布

阅读量586

点赞数

文章标签：自然语言处理深度学习机器学习

本文链接：https://blog.csdn.net/AI_Conf/article/details/124801185

版权

在这里插入图片描述

近年来，场景文本端到端检测识别取得了很大的进展。文本检测（text detection）和识别是计算机视觉领域中的两个主要问题，需要从图像中找到自然语言文本的位置并识别出具体的内容，在体育视频分析，自动驾驶，工业自动化等领域具有广泛的应用。随着深度学习的发展，当前最先进的文本检测和识别方法在处理多分辨率和多领域文本时在各个基准数据集展示了卓越的准确性。但是，仍然存在一些处理存在于广泛图像中文本的挑战，例如现有模型无法推广到此前未出现的数据和标记不足的数据，导致现有方法表现不佳。

关于文本检测，还有很多领域值得进一步探究。AMiner整理了相关领域的一些论文，助大家更深入了解近年来的发展情况。点击链接查看论文合集：https://www.aminer.cn/topic/5fd2eea292c7f9be2138c67b?f=cs

以下是从论文合集中整理出的一些优质论文：

1.Multi-Oriented Scene Text Detection Via Corner Localization And Region Segmentation

“在本文中，我们提出了一种方法，该方法结合了两种方法的思想，同时避免了它们的缺点。我们建议通过本地化文本边界框的角点并在相对位置分割文本区域来检测场景文本…我们的方法可以自然地处理长方向的文本，不需要复杂的后处理。在ICDAR2013、ICDAR2015、MSRA-TD500、MLT和COCO-Text上的实验表明，该算法在精度和效率方面均取得了更好或相当的结果…”

PDF下载链接：https://www.aminer.cn/pub/5ac1829d17c44a1fda917ea5/?f=cs

2.Rotation-Sensitive Regression For Oriented Scene Text Detection

“我们建议对不同特征的特征进行分类和回归，由不同设计的两个网络分支提取…所提出的名为旋转敏感回归检测器（RRD）的方法在多个定向场景文本基准数据集上实现了最先进的性能，包括ICDAR 2015，MSRA-TD500，RCTW-17和COCO-Text。此外，RRD在船舶收集数据集上实现了显着改进，证明了其在定向对象检测方面的通用性…”

PDF下载链接：https://www.aminer.cn/pub/5aed14e217c44a4438159a4e/?f=cs

3.TextBoxes: A Fast Text Detector with a Single Deep Neural Network.

“本文提出了一种名为TextBoxes的端到端可训练快速场景文本检测器，该检测器在单个网络正向传递中以高精度和高效率检测场景文本，除了标准的非最大抑制之外，不涉及后处理…TextBoxes在文本本地化准确性方面优于竞争对手的方法，并且速度更快，在快速实现中每个图像仅占用0.09s。此外，与文本识别器相结合，TextBoxes在单词识别和端到端文本识别任务方面明显优于最先进的方法…”

PDF下载链接：https://www.aminer.cn/pub/58d82fc8d649053542fd5b69/?f=cs

4.Deep Direct Regression For Multi-Oriented Scene Text Detection

“在本文中，我们首先提供了一个新的视角，将现有的高性能目标检测方法分为直接回归和间接回归…在多方向场景文本检测的背景下，我们分析了间接回归的缺点，它涵盖了最先进的检测结构Faster-RCNN和SSD作为实例，并指出了直接回归的潜在优势…所提出的方法特别有利于对偶然场景文本进行本地化。在ICDAR2015附带场景文本基准测试中，我们的方法实现了81%的F测量值，这是一种新的技术，并且显着优于以前的方法。在其他具有聚焦场景文本的标准数据集上，我们的方法也达到了最先进的性能…”

PDF下载链接：https://www.aminer.cn/pub/599c794a601a182cd262d446/?f=cs

5.Deep Matching Prior Network: Toward Tighter Multi-Oriented Text Detection

“我们提出了一种新的基于卷积神经网络（CNN）的方法，称为深度匹配先验网络（DMPNet），以检测具有更紧密四边形的文本…我们的方法的有效性在公共单词级，多方向场景文本数据库ICDAR 2015强健阅读竞赛挑战赛4“附带场景文本本地化”上进行评估。使用F测量法评估我们方法的性能，发现其为70.64%，优于现有的最先进的方法，F测量值为63.76%…”

PDF下载链接：https://www.aminer.cn/pub/599c797f601a182cd2644a16/?f=cs

6.COCO-Text: Dataset and Benchmark for Text Detection and Recognition in Natural Images.

“本文介绍了COCO-Text数据集…我们对注释的准确性进行统计分析。此外，我们还分析了数据集上三种领先的最先进的照片光学字符识别（OCR）方法。虽然近年来场景文本检测和识别取得了长足的进步，但我们发现了激励未来工作的重大缺陷…”

PDF下载链接：https://www.aminer.cn/pub/573696046e3b12023e5177fe/?f=cs

进入AMiner官网，查看更多优质论文：：https://www.aminer.cn/?f=cs

AMiner学术搜索和科技情报挖掘

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
【文本检测】必读论文合集推荐丨定向场景文本检测、多方向文本检测等

近年来，场景文本端到端检测识别取得了很大的进展。文本检测（text detection）和识别是计算机视觉领域中的两个主要问题，需要从图像中找到自然语言文本的位置并识别出具体的内容，在体育视频分析，自动驾驶，工业自动化等领域具有广泛的应用。随着深度学习的发展，当前最先进的文本检测和识别方法在处理多分辨率和多领域文本时在各个基准数据集展示了卓越的准确性。但是，仍然存在一些处理存在于广泛图像中文本的挑战，例如现有模型无法推广到此前未出现的数据和标记不足的数据，导致现有方法表现不佳。关于文本检测，还有很多领域.
复制链接

扫一扫