恒源云(GPUSHARE)_【ECCV 2020】RobustScanner 论文学习笔记

AI酱油君

已于 2022-02-23 16:09:58 修改

阅读量333

点赞数 2

分类专栏：深度学习文章标签：深度学习机器学习计算机视觉

于 2021-03-08 23:50:09 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_53977063/article/details/114557014

版权

本文介绍了ECCV 2020论文《RobustScanner》中的方法，针对语义信息不足的文本识别问题，提出了位置增强分支和动态融合模块，以增强解码器的位置信息，提高识别准确性。尽管在某些语义丰富的场景下可能效果不如基于语义的解码器，但在随机字符和弱语义文本中表现优秀。

摘要由CSDN通过智能技术生成

文章来源 | 恒源云（专注人工智能/深度学习GPU云服务器免费租用平台，官方体验网址：https://gpushare.com）

原文地址 | 【ECCV 2020】RobustScanner 论文学习笔记（学霸季奖励计划）

背景

通常STR识别论文中的实验数据集来自真实街景图片，其中包含大量语义信息。那么在decode时利用attention机制的decoder往往可以很好地利用这些语义信息，从而避免将apple预测成0pple的情况。然而实际项目中并不一定都是语义信息丰富的文本图片，遇到随机字符的组合或者弱语义文本识别，经典识别方法可能出现错误的预测结果。

通常对于这种情况，我的习惯是使用CTC解码器。而今天介绍一篇来自商汤团队ECCV2020的文本识别论文《RobustScanner- Dynamically Enhancing Positional Clues for Robust Text Recognition》，提出了一种增强位置信息的方法，来解决这一问题。

动机

作者发现目前的STR识别模型对于没有语义信息或者弱语义信息

最低0.47元/天解锁文章

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。