《Learn to Augment: Joint Data Augmentation and Network Optimization for Text》

最新推荐文章于 2024-01-02 07:48:35 发布

行秋

最新推荐文章于 2024-01-02 07:48:35 发布

阅读量702

点赞数 1

分类专栏：论文阅读文章标签： python 场景文字数据增强

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43042683/article/details/120679546

版权

论文阅读专栏收录该内容

8 篇文章 1 订阅

订阅专栏

论文原文，答辩PPT，读书报告，实现代码增强学习：文本识别的联合数据增强和网络优化.-CSDN下载

CVPR2020论文：

《Learn to Augment: Joint Data Augmentation and Network Optimization for Text》

原文链接

https://openaccess.thecvf.com/content_CVPR_2020/papers/Luo_Learn_to_Augment_Joint_Data_Augmentation_and_Network_Optimization_for_CVPR_2020_paper.pdfhttps://openaccess.thecvf.com/content_CVPR_2020/papers/Luo_Learn_to_Augment_Joint_Data_Augmentation_and_Network_Optimization_for_CVPR_2020_paper.pdf

官方代码实现

GitHub - Canjie-Luo/Text-Image-Augmentation: Geometric Augmentation for Text Imagehttps://github.com/Canjie-Luo/Text-Image-Augmentation

重写Python代码实现（非本人编码）

GitHub - RubanSeven/Text-Image-Augmentation-python: Python implementation of Text-Image-Augmentationhttps://github.com/RubanSeven/Text-Image-Augmentation-python

摘要

手写文本和场景文本存在各种形状和扭曲的图案。因此，训练一个健壮的识别模型需要大量的数据来尽可能地覆盖多样性。与数据收集和注释相比，数据增强是一种低成本的方式。本文提出了一种新的文本图像增强方法。与传统的旋转、缩放和透视变换等增强方法不同，我们提出的增强方法是为了学习适当和高效的数据增强，这对于训练一个健壮的识别器来说更加有效和具体。通过使用一组自定义基准点，所提出的增强方法具有灵活性和可控性。此外，我们还通过联合学习在孤立的数据扩充过程和网络优化过程之间架起了一座桥梁。代理网络从识别网络的输出中学习，并控制基准点来为识别网络生成更合适的训练样本。在包括规则场景文本、不规则场景文本和手写文本在内的各种基准上的大量实验表明，所提出的增强和联合学习方法显著提高了识别网络的性能。提供了用于几何增强的通用工具包。

答辩PPT

代码实现

参考链接

CVPR2020场景文字数据增强（纯python实现） - 知乎CVPR2020论文： Learn to Augment: Joint Data Augmentation and Network Optimization for Text Learn to Augment: Joint Data Augmentation and Network Optimization for Text RecognitionC++版本： Canjie-Luo…https://zhuanlan.zhihu.com/p/106007602

输入图片：

输出图片：

使用开发环境：Python3.7 Pycharm2019

下载代码，运行即可。

安装 NumPy 最简单的方法就是使用 pip 工具：

pip3 install --user numpy scipy matplotlib

--user 选项可以设置只安装在当前的用户下，而不是写入到系统目录。

默认情况使用国外线路，国外太慢，我们使用清华的镜像就可以:

pip3 install numpy scipy matplotlib -i https://pypi.tuna.tsinghua.edu.cn/simple

没有找到cv2，应该安装opencv-python

pip install opencv-python scipy matplotlib -i https://pypi.tuna.tsinghua.edu.cn/simple

没有找到imageio，应该安装imageio

pip install imageio scipy matplotlib -i https://pypi.tuna.tsinghua.edu.cn/simple

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

行秋 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。