关于开源OCR引擎的调研
一、OCR引擎比较
1. 优图OCR (腾讯)
https://ai.qq.com/product/ocr.shtml#common
免费API:https://api.ai.qq.com/fcgi-bin/ocr/ocr_generalocr
该引擎专注于行识别,识别结果准确度高达98%,误识率较低,以文本形式输出。
(有开放免费的API,没找到开源项目,似乎是个在线服务)
2. Tesseract OCR(Google)
https://github.com/tesseract-ocr/tesseract#about
有三个数据集可供选择:
tessdata-best准确度最高,速度最慢https://github.com/tesseract-ocr/tessdata_best
tessdata准确度中等,速度中等https://github.com/tesseract-ocr/tessdata</