(论文笔记)TextMountain: Accurate Scene Text Detection via Instance Segmentation

今天来谈一谈对Textmountain的个人理解(如有不准确的地方欢迎读者指正):

这篇论文的思想很新颖,将之前的binary文本分割变为text center-border probability (TCBP),充分利用文本信息内部的过度关系,同时预测了指向文本中心的向量TCD帮助文本实例更好地找到文本中心。

  • 主要思想:FCN+充分利用文本边界-中心信息,进行文本实例的分割,推理阶段:每个在山脚的像素都要寻找一条去山顶的路径,这个过程同时可以并行执行。

  • 名词简介:与先前的把它当做二分类任务不同,作者预测文本中心-边界概率(TCBP)以及文本中心方向(TCD),

    • TCBP就像一个山一样(山峰是中心,山脚是边界)。    山顶可以很容易地分离文本实例(通过语义分割),而它上升的方向可以给山脚提供一个向上攀爬路径(TCD)

    • TCD可以很好地帮助属于这个文本的像素更好的归属过去。

  • 方法步骤:

    • 首先设置一个阈值,从TCBP和TS产生文本中心实例图和文本边界图

    • 用TS计算每个文本中心实例的平均score(文本中心图可以很好地分离文本,而TS不一定)

    • 每个山脚的像素点通过TCBP上升的方向或者TCD的方向找到它属于的山峰,找到一个山峰之后,该点属于这个文本。

  • TS模块:难负样本挖掘+交叉熵  1:3  

  • TCBP(sigmoid [0,1])

    • 虽然之前有二分类,但作者认为这样的标注太绝对了,有的时候对于边界和中心的分界不够准确

    • TCBP里面有更多的信息可以用:比如概率的上升方向

    • 标注简单:只用垂线去做label

  • TCD

    • 指向它属于的中心

    • 点离中心越远、推力越强

    • 两条相邻的文本线虽然可能有相同的TCBP但是会有完全不同的TCD(可以帮助分离相邻文本线)

    • 归一化:只需vector的方向

  • Group in parallel(预测每个山脚像素属于哪个山峰):

    • TCBP上升的方向+TCD,TCBP设置阈值0.6

    • 首先生成TCBP和TCD的有向图:TCBP八邻域,TCD量化方向

    • 有向图生成之后:每个border的像素点沿着有向图爬到顶点,然后把它自己喷上相应的颜色。

      • 并行处理,快速(山脚到达半山腰,半山腰已到山顶,那么山脚的点可以直接涂上半山腰的点)

      • 算法

  • Implementation Details

    • SGD

    • BN

    • FPN双线性插值上采样

    • MLT预训练模型

    • 数据增强

    • 随机旋转角度

  • 贡献点

    • 提出了TS TCBP TCD,TCBP能更好地分离文本线,TCD能帮助TCBP训练的更好。

    • 可以很好地处理长、多方向、弯曲的文本。

    • 提出一个并行的组合算法,能促进后处理过程。

    • 在矩形或者弯曲的上面都达到很好的效果。

  • 好处

    • 没有定义文本角度,对角度鲁棒,也可以处理弯曲的

    • 不需要感受野的限制,没有角度的模糊表达。不定义顶点,而是很好地利用文本的shape(走向)

    • 长、多方向、弯曲的文本。

  • experiments

    • RCTW-17:18w 中文数据集

    • SCUT-CTW1500 新开源曲线文本数据集

 

 

  • 3
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 16
    评论
你好!对于 "Region-Based Convolutional Networks for Accurate Object Detection and Segmentation" 这篇论文的复现,我可以给你一些指导。该论文介绍了一种基于区域的卷积神经网络方法,用于准确的物体检测和分割。 首先,你需要了解论文中提出的方法的核心思想和技术细节。然后,你可以按照论文中描述的步骤进行复现。以下是一些可能的步骤: 1. 数据集准备:根据论文中使用的数据集,你需要获取相应的训练集和测试集数据。确保数据集包含物体检测和分割的标注信息。 2. 模型架构:根据论文中描述的模型架构,你可以使用深度学习框架(如TensorFlow、PyTorch等)来构建模型。确保按照论文中提到的网络层次结构、连接方式和参数设置来构建模型。 3. 损失函数:根据论文中提到的损失函数,你可以实现相应的损失函数来衡量检测和分割任务的性能。 4. 训练过程:使用训练集数据对模型进行训练。根据论文中提到的训练策略和超参数设置,你可以使用反向传播算法来更新模型的权重。 5. 测试过程:使用测试集数据对训练好的模型进行测试。评估模型在物体检测和分割任务上的性能,并与论文中的结果进行比较。 请注意,由于论文可能没有提供完整的代码实现,你可能需要根据论文的描述进行一定的调整和优化。 希望这些步骤能为你复现该论文提供一些帮助!如果你有任何进一步的问题,欢迎继续提问。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 16
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值