CVPR 2019 论文大盘点—文本图像相关篇

最新推荐文章于 2022-11-03 17:05:18 发布

OpenCV中文网公众号

最新推荐文章于 2022-11-03 17:05:18 发布

阅读量451

点赞数 1

文章标签：人工智能机器学习计算机视觉深度学习 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bevison/article/details/109234284

版权

CV君盘点了 CVPR 2019 文本图像相关论文，总计 17 篇。

其中研究文本检测的最多，共 7 篇，包括已经非常知名的PSENet，还有最近异常火爆的CRAFT。

文本识别 4 篇，其中华南理工大学的 Aggregation Cross-Entropy 代码已经开源，其不仅适用于文本数据，序列数据识别均可参考。

数据增广 2 篇，文本数据是天然易于在训练时进行样本增广的，而GAN也被成功应用于这一方向。

北大的 2 篇文本风格迁移非常有意思，也许在设计领域很有用处。Facebook 将 OCR 引入视觉问答的课题中，推进了视觉问答更智能。西安交大手写签名的论文，解决好了的话在这个网络时代应该很有用。

开源代码地址也一并列出了，希望对研究开发相关方向的同学有帮助。

文本检测

利用条件空间扩展实现鲁棒弯曲文本检测

南洋理工大学、阿德莱德大学

Towards Robust Curve Text Detection With Conditional Spatial Expansion

Zichuan Liu, Guosheng Lin, Sheng Yang, Fayao Liu, Weisi Lin, Wang Ling Goh

字符区域感知的文本检测，不仅利用字符本身特征还利用字符之间的关系。在MSRA-TD500数据集上目前是最好的算法。

Clova AI Research, NAVER Corp

Character Region Awareness for Text Detection

Youngmin Baek, Bado Lee, Dongyoon Han, Sangdoo Yun, Hwalsuk Lee

https://github.com/clovaai/CRAFT-pytorch

自适应文本区域表示，用于任意形状的场景文本检测，在5个文本检测数据集上都达到了state-ofthe-art。

三星中国研究院、中科院自动化所、中科院大学、韩国三星研究院

Arbitrary Shape Scene Text Detection With Adaptive Text Region Representation

Xiaobing Wang, Yingying Jiang, Zhenbo Luo, Cheng-Lin Liu, Hyunsoo Choi, Sungjin Kim

形状感知嵌入学习用于场景文本检测

香港中文大学、约翰霍普金斯大学、腾讯优图实验室

Learning Shape-Aware Embedding for Scene Text Detection

Zhuotao Tian, Michelle Shu, Pengyuan Lyu, Ruiyu Li, Chao Zhou, Xiaoyong Shen, Jiaya Jia

渐近扩展网络，用于形状鲁棒的文本检测

南京大学、同济大学、南京理工大学、Momenta、旷视科技

Shape Robust Text Detection With Progressive Scale Expansion Network

Wenhai Wang, Enze Xie, Xiang Li, Wenbo Hou, Tong Lu, Gang Yu, Shuai Shao

https://github.com/whai362/PSENet

一种迭代的不断提精的高精度任意形状文本检测方法，在多个数据集达到了state-of-the-art。

百度、厦门大学

Look More Than Once: An Accurate Detector for Text of Arbitrary Shapes

Chengquan Zhang, Borong Liang, Zuming Huang, Mengyi En, Junyu Han, Errui Ding, Xinghao Ding

提出场景文本检测结果度量的新协议，更加以有利于进一步识别为导向，更加注重检测结果的完整性（Completeness）、紧凑性（Compactness）、细腻度（Tightness-aware）

华南理工大学

Tightness-Aware Evaluation Protocol for Scene Text Detection

Yuliang Liu, Lianwen Jin, Zecheng Xie, Canjie Luo, Shuaitao Zhang, Lele Xie

https://github.com/Yuliang-Liu/TIoU-metric

文本识别

提出一种聚合交叉熵损失函数，用于序列数据识别，可有效替换CTC+注意力机制，实现简单、计算快速、存储要求低、方便替换CTC。

华南理工大学

Aggregation Cross-Entropy for Sequence Recognition

Zecheng Xie, Yaoxiong Huang, Yuanzhi Zhu, Lianwen Jin, Yuliang Liu, Lele Xie

https://github.com/summerlvsong/Aggregation-Cross-Entropy

数字文档中关键字检索的深度特征方法，高效、存储要求低。

NCSR “Demokritos”、希腊国立雅典理工大学、希腊约阿尼纳大学

An Alternative Deep Feature Approach to Line Level Keyword Spotting

George Retsinas, Georgios Louloudis, Nikolaos Stamatopoulos, Giorgos Sfikas, Basilis Gatos

通过迭代的图像校正进行端到端的场景文本识别

南洋理工大学

ESIR: End-To-End Scene Text Recognition via Iterative Image Rectification

Fangneng Zhan, Shijian Lu

https://github.com/fnzhan/ESIR

序列到序列的域适应网络，用于鲁棒文本图像识别

中科院自动化所、中科院大学、电子科技大学、浙江大学、阿凡题人工智能研究院

Sequence-To-Sequence Domain Adaptation Network for Robust Text Image Recognition

Yaping Zhang, Shuai Nie, Wenju Liu, Xing Xu, Dongxiang Zhang, Heng Tao Shen

文本图像数据增广

空间融合GAN进行图像合成

结合几何与表面信息的空间融合生成对抗网络，用于图像合成，其中合成的文本图像改进了文本识别的训练

南洋理工大学、新加坡A*STAR

Spatial Fusion GAN for Image Synthesis

Fangneng Zhan, Hongyuan Zhu, Shijian Lu

https://github.com/Sunshine352/SF-GAN

提出一种对抗特征变形模块（AFDM），用于训练数据匮乏的手写文本识别。

南洋理工大学、Institute of Engineering & Management, India、Jadavpur University, India、Indian Institute of Technology Roorkee, India

Handwriting Recognition in Low-Resource Scripts Using Adversarial Learning

Ayan Kumar Bhunia, Abhirup Das, Ankan Kumar Bhunia, Perla Sai Raj Kishore, Partha Pratim Roy

https://github.com/AyanKumarBhunia/Handwriting_Recogition_using_Adversarial_Learning

文本风格迁移

文本特效（风格）迁移

北京大学

Typography with Decor: Intelligent Text Style Transfer

Wenjing Wang, Jiaying Liu, Shuai Yang, and Zongming Guo

https://github.com/daooshee/Typography-with-Decor

基于样例的动态文本特效迁移

北京大学

DynTypo: Example-Based Dynamic Text Effects Transfer

Yifang Men, Zhouhui Lian, Yingmin Tang, Jianguo Xiao

https://menyifang.github.io/projects/DynTypo/DynTypo.html

OCR + 视觉问答

图像内OCR文本识别 + 基于此更准确的视觉问答

Facebook、佐治亚理工学院

Towards VQA Models That Can Read

Amanpreet Singh, Vivek Natarajan, Meet Shah, Yu Jiang, Xinlei Chen, Dhruv Batra, Devi Parikh, Marcus Rohrbach

https://github.com/facebookresearch/pythia

签名鉴伪

反向鉴别网络，用于手写签名验证

西安交通大学

Inverse Discriminative Networks for Handwritten Signature Verification

Ping Wei, Huan Li, Ping Hu

备注：OCR

OCR交流群

文本检测、识别、编辑等技术，

若已为CV君其他账号好友请直接私信。

我爱计算机视觉

微信号:iopencv

QQ群:805388940

微博知乎:@我爱计算机视觉

投稿:amos@52cv.net

网站:www.52cv.net

OpenCV中文网公众号

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
CVPR 2019 论文大盘点—文本图像相关篇

CV君盘点了 CVPR 2019 文本图像相关论文，总计 17 篇。其中研究文本检测的最多，共 7 篇，包括已经非常知名的PSENet，还有最近异常火爆的CRAFT。文本识别 4 篇，其...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。