Ubuntu/Debian/Deepin安装:
直接使用apt安装
sudo apt-get insatll -y tesseract-ocr libtesseract-dev liblepyonica-dev
查看支持语言:
tesseract --list-langs
开始支持语言并不多,需要我们自己下载
sudo git clone https://github.com/tesseract-ocr/tessdata.git
sudo mv tessdata/* /usr/shar/tesseract/4.0/tessdata
#注意:4.0为版本名,版本不尽相同,要找好位置
再次查看支持语言:
tesseract --list-langs
再次安装:
sudo pip3 install tesserocr pillow
测试
保存一张图片,用以下命令执行
tesseract xxx.png result -l eng
##xxx.png 为当前目录下照片名字
##result 为导出文本的文本名称
##-l 所用语言 eng==english