pytesseract库的安装
因为用的win10,就直说windows上面的安装了。其实就是pip安装就完事了。
$ pip install pytesseract
安装了这个还不算完,得安装Tesseract-OCR,安装这个软件的时候,因为我们需要识别中文,所以还需要额外安装中文语言包:
点击Additional language data(download)
旁边的加号,勾选中文语言包,然后就一路Next了:
最后,你还可以将tesseract.exe加进系统的Path
里面。
简单使用
pytesseract不仅支持英文,还支持很多其他语言,从上面安装过程中勾选的地方就能看出来,中文,也不例外。
要使用pytesseract,其实很简单: