获取tesseract
作为开源项目,tesseract的官方资源可以从GitHub上面得到。阅读readme文件可以解决大部分初步使用者的疑问。
tesseract在GitHub上的链接:https://github.com/tesseract-ocr/tesseract
使用homebrew安装tesseract:
brew install tesseract
安装好后,在终端输入tesseract会出现帮助文档。
查看装好的语言库:
tesseract --list-langs
可以看见只有英语(eng),于是我又装了简体中文(chi_sim)。在https://github.com/tesseract-ocr/tessdata中下载chi_sim.traineddate,放在tesseract的目录(/usr/local/Cellar/tesseract/3.05.01/share/tessdata)下。