恒源云(GPUSHARE)_【CVPR 2020】ContourNet 论文学习笔记 | 深度学习训练

AI酱油君

已于 2022-02-23 16:09:55 修改

阅读量390

点赞数 5

分类专栏：深度学习文章标签：深度学习计算机视觉机器学习

于 2021-03-03 17:25:27 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_53977063/article/details/114324510

版权

文章来源 | 恒源云（专注人工智能/深度学习GPU免费加速平台，官方体验网址：https://gpushare.com）

原文地址 | 【CVPR 2020】ContourNet 论文学习笔记（学霸季奖励计划）

一、背景

虽然ocr发展了很多年，也有了非常不错的表现，但在场景文本识别领域仍然有很多挑战：
1、真实场景下文本样式复杂、背景杂乱
2、图像质量参差不齐
3、文本方向各异甚至弯曲文本
4、文本过密、尺寸过长、过小
。。。

通常STR会分为：文本检测和文本识别两个问题，当然也有很多研究关注于end-to-end文本识别。

其中检测方面，2019年韩国NAVER Clova AI Research的Craft为我们提供了一个很优秀的模型，这种类型的检测模型属于自下而上的分割，即先分割再实例化为一个个文本，类似的还有DBNet、PSENet。然而我在实际应用时发现，对于多行密集文本场景，往往会将其识别为同一个文本区域，这给后续文本识别任务带来了不小的麻烦。

本文介绍的ContourNet是cvpr2020的一篇属于自上而下的文本检测方法，即先识别到文本框，再分割出文本mask区域。类似的还有maskRcnn、SPCNet等。这一思路我认为可

最低0.47元/天解锁文章

关注

5
点赞
踩
5

收藏

觉得还不错? 一键收藏
5
评论
恒源云(GPUSHARE)_【CVPR 2020】ContourNet 论文学习笔记 | 深度学习训练

文章来源 | 恒源云（专注人工智能/深度学习GPU免费加速平台，官方体验网址：https://gpushare.com）原文地址 |【CVPR 2020】ContourNet 论文学习笔记（学霸季奖励计划）一、背景虽然ocr发展了很多年，也有了非常不错的表现，但在场景文本识别领域仍然有很多挑战：1、真实场景下文本样式复杂、背景杂乱2、图像质量参差不齐3、文本方向各异甚至弯曲文本4、文本过密、尺寸过长、过小。。。通常STR会分为：文本检测和文本识别两个问题，当然也有很多研究关注于..
复制链接

扫一扫

专栏目录

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。