简述:
根据CASIA的HWDB1.X的手写字符生成了一些带有字符级标注、行级别标注的文本数据,分享给需要的同学。
- 生成基于不同人的字体、字体大小、行间字体间隔、旋转角度、文本布局的文字贴图。
- 生成素材:共65种贴图背景, 由420位手写字体作者完成的71,122个符号, 1,609,136个汉字/3,866类。
- 数据量:Train:2597张, Test:662张,目前完了HWDB1.0部分,part2,part3如果需要后期可以继续制作。
字符素材:
数据示例:
字符级标注信息:
行级标注信息:
CASIA HWDB数据下载地址:http://www.nlpr.ia.ac.cn/databases/handwriting/Download.html
欢迎加入OCR交流群,在群文件中可以直接领取生成数据~~~