简介
本文主要介绍如何通过tesseract进行文字识别,及其识别效果。效果图
图片 | |
---|---|
测试图 | ![]() |
测试结果 | ![]() |
环境
- ubuntu
- python2.7
安装
- tesseract
sudo apt-get install tesseract-ocr
- 安装tesseract tessdata
https://github.com/tesseract-ocr/tessdata 下载对应语言文字学习数据,并保存到
/usr/share/tesseract-ocr/tessdata
或/usr/share/tessdata
位置 pyocr
sudo pip install pyocr