目标检测论文 Precise detection of Chinese characters in historical documents with DRL

Precise detection of Chinese characters in historical documents with deep reinforcement learning

发表于 Pattern Recognition 2020
DOI:https://doi.org/10.1016/j.patcog.2020.107503
代码暂未开源

Abstract:
Here, we use this method for precise character detection by making tight bounding boxes around the Chinese characters in historical documents. An agent is trained to learn the control policy of fine-tuning a bounding box step-by-step through a Markov Decision Process.
We introduce a novel fully convolutional network with position-sensitive Region-of-Interest (RoI) pooling (FCPN). The network receives character patches as input without fixed size, and it can fuse position information into the fea- tures of actions. Besides, we propose a dense reward function (DRF) that provides excellent rewards according to different actions and environment states, improving the decision-making ability of the agent.

Contributions:
1)利用深度强化学习框架在大IoU下获得更紧密边界框的一种精确检测汉字的新方法,可以在文本检测器之后应用。
2)带有位置敏感的RoI池化(FCPN)的全卷积网络,可以在使用深度强化学习的微调过程中接收任意大小的字符补丁;这些形状不需要固定大小的输入。
3)一种用于训练过程的新型密集奖赏功能(DRF)。借助出色的奖励回报,代理对不同的行为和环境状态更加敏感。因此,代理可以有效地学习,从而增强决策能力。
4)将Dueling DQN [11],Double DQN [12]和优先体验重播[13]方法的优点结合在一起,以简单有效的DQN变体训练代理。提出的精度检测方法在TKH和MTH数据集上均优于最新方法,在IoU 0.8准则下具有显着改进。
5)此方法扩展到场景文本检测领域,在该领域中,字符背景通常很复杂且难以区分。并对动作建模方法进行了少许修改,并获得了有希望的结果,表明这项工作的有效性和普遍性。

Method :
首先,通过文本检测器粗略地检测字符。然后,使用深度强化学习(DRL)精炼每个字符,并获得最终的精确结果。
如图蓝色虚线部分所示,以原始粗略检测到的汉字区域w * h为输入,基本主干特征提取器由两个残差块组成,每个残差块均由三个卷积层组成。受Dueling网络[11]想法的启发,在backbone输出的末尾,精心设计了两个流,通过使用位置敏感的RoI池分别估计状态值和每个动作的优势[21]整合行为的位置信息。

图2提出的具有位置敏感RoI池的全卷积网络的详细结构,k,s,p分别是内核,步幅和填充大小;红色圆角矩形中的w,h,c,s和g分别表示pooling宽度,高度,输出通道,空间大小和组大小。

图3
窗口中的箭头表示移动方向。第五动作表示停止。

图4
提升效果:F-measure

表1
这个方法感觉相当于一个损失函数,把已有方法的粗略检测结果作为输入,用深度强化学习进行坐标微调,更接近真值。

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

yddcs

你的鼓励--创作的动力!!!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值