介绍合成中文识别数据集的相关repo
SynthText_Chinese_version
修改自SynthText(CVPR2016),用于生成自然场景文本图像。
备注:但代码给人的感觉是很混乱,没有清晰结构,目前作者也停止了维护,代码基于OpenCV2.4,版本过旧无法pip直接安装或者需要自己改动一些代码。
TextRecognitionDataGenerator
一个合成数据生成器用于文本识别
备注:代码结构清晰,作者一直在维护,有官方文档。
注意事项
参数说明有官方手册,这里不再赘述。说一下实际遇到的几个问题:
- 倾斜角度问题:倾斜角不宜过大,过大会导致它为了在指定高度框中容下倾斜文本,将字体缩的很小。建议5度>以内。
- 模糊问题:模糊参数仅支持整型,设为1合适。
- 标签问题:源代码中仅有三种标签,不支持img_id to label_id,可以修改
string_genera