FOTS: Fast Oriented Text Spotting with a Unified Network阅读笔记

45 篇文章 55 订阅 ¥19.90 ¥99.00

        场景文本识别一般分为两步处理文本检测和文本识别。但是这样花费的时间比较多,尤其是文本区域多的时候,另一方面两步处理会忽视两者之间的共享相关联的信息。所以本文提出通过ROIRotate操作将两者结合起来进行联合训练,可以看成是端对端的。这是目前第一个端对端的有向(可识别非水平)文本识别网络,结果表明本网络识别速度快,达到了时时水平,并且比目前所有的结果高5%。

        本文的主要创新点为提出ROIRotate,识别率高同时识别速度快到实时水平。

框架:

        总共分为四个部分: 共享卷积、文本检测分支,RoI Rorate操作和文本识别分支。图像经过一个共享卷积模块提取共享特征(文本检测和文本识别共享),共享特征输入到文本检测分支输出预测边框,同时输入RoI Rotate提取建议文本特征输入文本识别分值,最终预测文本结果。

1.共享卷积

        框架借鉴res50,受到金字塔特征网络影响,作者将低级别的特征和高级别的语义特征拼接在一起,Deconv包含一个卷积操作和上采样操作.

2.文本检测分支

        作者采用全卷积神经网络,由于场景图片包含许多小文本,所以作者在共享卷积中将特征图上采样,尺寸从原图的1

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

yang_daxia

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值