读论文之ObjectProposals for Text Extraction in the Wild

最新推荐文章于 2022-05-18 13:03:08 发布

深蓝大人

最新推荐文章于 2022-05-18 13:03:08 发布

阅读量720

点赞数

分类专栏：读论文文章标签：目标检测

本文链接：https://blog.csdn.net/bluer411945935/article/details/49402367

版权

读论文专栏收录该内容

2 篇文章 0 订阅

订阅专栏

读论文之ObjectProposals for Text Extraction in the Wild

——论文源代码地址：https://github.com/lluisgomez/TextProposals

概述：目标检测的论文很多，该论文将很多目标检测方法特定到文字检测，论文前一部分主要简单陈述了已有的目标检测方法对于文字检测的分析，后一部分提出了自己的方法，包括初始化、创建假设、排序打分，最后是评估。

introduction末尾部分说作者提出了一种简单的用于文字区域目标检测的选择搜索（Selective Search）策略，初始化的区域用agglomerative clustering形成一个层次，层次的每一个节点都是可能的文字区域假设。至于接着提到作者的方法和各种其他方法做evaluate，目前初了解阶段不是太感兴趣。

第III部分，开头便提出了整个论文方法的客观基础，很关键的就是图片文字区域的文字这种原子对象的成组聚集性，基于这种性质使用了对这种特性敏感的聚类方法。

具体方法分为三步：

第一步、

用最大稳定极值区域算法MaximallyStable Extremal Regions (MSER) algorithm初始化区域Regions，对于MSER可以参考【1】，源代码中使用的是opencv自带的实现，使用的是q(i)=|Q_i-Q_i_-_△|/|Q_i_-_△|这个公式，程序运行时的参数<mser_delta>就是这个公式里的delta。输出的一系列初始的区域。接下来对这些这些区域进行筛选。

第二步、

补充距离（complementarydistance metrics）作为标准做single linkage criterion (SLC)，其实就是用自定义的距离公式（d(i)(ra, rb) = (f i(ra)−f i(rb))2+(xa−xb)2+(ya −yb)2）做合并初始区域的操作。

整体的算法流程见下图（引用自【2】）