合成中文识别数据集的相关repo

本文介绍了两个用于合成中文识别数据集的GitHub仓库:SynthText_Chinese_version,虽代码较旧但能生成自然场景文本图像;以及TextRecognitionDataGenerator,代码结构清晰并持续维护,适用于文本识别。注意倾斜角度、模糊程度、标签、边界和字体选择等参数调整。
摘要由CSDN通过智能技术生成

介绍合成中文识别数据集的相关repo

SynthText_Chinese_version

修改自SynthText(CVPR2016),用于生成自然场景文本图像。
备注:但代码给人的感觉是很混乱,没有清晰结构,目前作者也停止了维护,代码基于OpenCV2.4,版本过旧无法pip直接安装或者需要自己改动一些代码。

TextRecognitionDataGenerator

一个合成数据生成器用于文本识别
备注:代码结构清晰,作者一直在维护,有官方文档。

注意事项

参数说明有官方手册,这里不再赘述。说一下实际遇到的几个问题:

  1. 倾斜角度问题:倾斜角不宜过大,过大会导致它为了在指定高度框中容下倾斜文本,将字体缩的很小。建议5度>以内。
  2. 模糊问题:模糊参数仅支持整型,设为1合适。
  3. 标签问题:源代码中仅有三种标签,不支持img_id to label_id,可以修改string_genera
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值