类别: 文本合成
来源: CVPR2020,旷视
code: https://jyouhou.github.io/UnrealText/
摘要: 合成数据是训练场景文本检测和识别模型的关键工具。一方面,在场景文本识别器的训练中,合成词图像已被证明是真实图像的成功替代品。然而,另一方面,场景文本检测器仍然严重依赖于大量手工注释的真实世界图像,这是非常昂贵的。在本文中,我们介绍了一种有效的图像合成方法UnrealText,该方法通过3D图形引擎生成真实的图像。3D合成引擎通过渲染场景和文本作为一个整体提供了真实的外观,并允许更好的文本区域建议与访问精确的场景信息,如正常和甚至对象网格。综合实验验证了该方法在场景文本检测和识别中的有效性。我们还生成了一个多语言版本,用于未来多语言场景文本检测和识别的研究。
…