在闲暇时刻做了一个中文识别能力的工程,工程主要对中文文字进行识别,当前工程没有检测文本能力,后续会加入。文本字段在32000验证集合上准确率为83.2%. 可识别中文字符5990。
由于没有时间做太多优化,可能对于相近字体的准确率并不太高。但是可以作为一个OCR识别的体验代码。
git仓库地址为https://github.com/1006927966/chineseocr/tree/main 其中模型网盘下载链接也在仓库中。欢迎各位同学体验。
黑色为识别结果
算法支持最大为16的字符识别