ocr文字识别数据集
目前正在做ocr文字识别相关的项目,做了一些调研,今天做个周结,首先是几个开源框架对比吧!
EasyOCR、Chineseocr、Chineseocr_lite
我主要看的是GitHub中的一些项目,这三个OCR识别工具是Github里包含中文OCR功能的。第一、EasyOCR是全语种的(包括70+门外语识别),不单单针对中文,所以它的官方文档自然也都是英文了。对于英文不好的小伙伴来说很不友好。因此这里主要还是基于Chineseocr_和Chineseocr_lite。
1 EasyOCR
这个我没用就简单了解一下:
2chineseocr
github上训练好的模型做测试,项目里有提供训练数据的百度网盘下载,有资源的同学可以自己跑跑看。
通过搜集来的几个不同OCR测试数据集(github上有很多现成的,包括生成数据集、现实数据集等)随机选1000张图片来测试。