FOTS: Fast Oriented Text Spotting with a Unified Network阅读笔记

45 篇文章 55 订阅 ¥19.90 ¥99.00
FOTS是首个端到端的有向文本识别网络,结合文本检测和识别,通过ROIRotate操作提高效率。共享卷积模块提取特征,文本检测分支预测边框,RoI Rotate操作转换特征,文本识别分支使用CTC解码。实验结果显示,FOTS在多个数据集上表现优越,实现实时识别速度。
摘要由CSDN通过智能技术生成

        场景文本识别一般分为两步处理文本检测和文本识别。但是这样花费的时间比较多,尤其是文本区域多的时候,另一方面两步处理会忽视两者之间的共享相关联的信息。所以本文提出通过ROIRotate操作将两者结合起来进行联合训练,可以看成是端对端的。这是目前第一个端对端的有向(可识别非水平)文本识别网络,结果表明本网络识别速度快,达到了时时水平,并且比目前所有的结果高5%。

        本文的主要创新点为提出ROIRotate,识别率高同时识别速度快到实时水平。

框架:

        总共分为四个部分: 共享卷积、文本检测分支,RoI Rorate操作和文本识别分支。图像经过一个共享卷积模块提取共享特征(文本检测和文本识别共享),共享特征输入到文本检测分支输出预测边框,同时输入RoI Rotate提取建议文本特征输入文本识别分值,最终预测文本结果。

1.共享卷积

   

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

yang_daxia

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值