1. Tesseract-OCR的安装
首先下载Tesseract-OCR的安装文件。
下载地址为:(1) https://github.com/tesseract-ocr/tesseract/wiki/Downloads
(2) https://digi.bib.uni-mannheim.de/tesseract
我是使用第二个地址,直接下载了一个tesseract-ocr-setup-3.05.01.exe安装文件。
运行该文件即可开始安装。
有两点需要注意:
(1)加载语言数据的时默认是只安装英语,如果希望用tesseract处理其他语种的文本,需要手动勾选Additional languag