p`的方式即可安装:
pip install pytesseract
并且,需要读取图片,需要借助一个第三方库叫做PIL
。通过pip list
看下是否安装。如果没有安装,通过pip
的方式安装:
pip install PIL
使用pytesseract
将图片上的文字转换为文本文字的示例代码如下:
import pytesseract
from urllib import request
from PIL import Image
import time
pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"
captchaUrl = "https://passport.lagou.com/vcode/create?from=register&refresh=1513081451891"
request.urlretrieve(captchaUrl,'captcha.png')
image = Image.open("C:/Users/86132/Desktop/img2.PNG")
text = pytesseract.image_to_string(image,lang='chi_sim')
#,lang=‘eng’ 识别英文
print(text)