本文盘点CVPR 2020 所有文本图像(text)相关论文,主要分为手写文本和场景文本两大方向,总计16篇,对文献进行了细致的分类,大部分论文是围绕识别问题的研究。
方向包括:
1)场景文本检测(Scene Text Detection),从街景等场景文本中检测文本的位置,2 篇文献均为不规则任意形状文本的检测;
2)场景文本识别(Scene Text Recognition),对场景文本检测得到的结果进行识别,共 4 篇文章;
3)手写文本识别(Handwritten Text Recognition),2 篇文章;
4)场景文本端到端识别(Scene Text Spotting),1 篇文章,即华南理工大学和阿德莱德大学学者提出的实时 ABCNet 算法,很吸引人,已经开源;
5)手写文本生成(Handwritten Text Generation),为了增加手写文本的训练样本(感觉也可以用来“写作业”),1 篇文章;
6)场景文本合成(Scene Text Synthesis),为了增加场景文本的训练样本,1 篇文章,出自旷视科技,UnrealText用渲染引擎生成逼真场景文本;
7)文本图像的数据增广,用于手写和场景文本识别算法的训练,1 篇文章;
8)场景文本编辑(Scene Text Editor),对场景文本图像中的文字进行替换;
9)碎纸文档重建,用于刑侦领域的文档被破坏成碎片后的重建,1篇;
10)文本风格迁移,1篇;
11)场景文本识别的对抗攻击研究,1篇;
12)笔迹鉴定,1篇。
值得一提的,16篇文章中10篇已经开源或者准备开源,感谢这些开发者~
已经开源或者即将开源的论文,把代码地址也附上了。
大家可以在:
http://openaccess.thecvf.com/CVPR2020.py
按照题目下载这些论文。
如果想要下载所有CVPR 2020论文,请点击这里:
CVPR 2020 论文全面开放下载,含主会和workshop
场景文本检测
深度关系推理图网络用于任意形状文本检测
[1].Deep Relational Reasoning Graph Network for Arbitrary Shape Text Detection
作者 | Shi-Xue Zhang, Xiaobin Zhu, Jie-Bo Hou, Chang Liu, Chun Yang, Hongfa Wang, Xu-Cheng Yin
单位 | 北京科技大学;中国科学技术大学人工智能联合实验室;腾讯科技(深圳)
代码 | https://github.com/GXYM/DRRG
备注 | CVPR 2020 Oral
解读 | https://blog.csdn.net/SpicyCoder/article/details/105072570