1. 安装 tesseract-ocr 包
apt-get install tesseract-ocr
直接不能运行就用更高的权限
2. 安装 PIL
如果没有PIL也要下载apt-get install python-imaging
3. 安装 pytesseract
pip install pytesseract
然后就能用了
import pytesseract
from PIL import Image
img = Image.open("aa.jpg")
code = pytesseract.image_to_string(img)
print(code)
随便一截
跑一跑:
我觉得海星
附记:
在终端底下也能用:‘
查看语言包:
添加中文包:
主要的呢是先要找到tesseract-ocr/tessdata
这个文件夹的位置
有的说是这 /usr/local/Cellar/tesseract/3.05.02/share/tessdata
但是,我的找不到,然后就只能靠运气了,结果在这:/usr/share/tesseract-ocr/tessdata/
接下来就好办了,传送门,下载chi_sim.traineddata,还要移动哈,mv chi_sim.traineddata /usr/share/tesseract-ocr/tessdata/
再tesseract --list-langs
顾的