环境准备:
- pip install pillow # 安装PIL, 处理图片的库
- pip install pytesseract
- pip install urllib # 用到urllib.request.urlretrieve来通过url下载图片到本地
测试代码:
import pytesseract
from PIL import Image
from urllib import request
import time
def main():
while True:
url = "https://passport.lagou.com/vcode/create?from=register®ister&refresh=1513081451891"
request.urlretrieve(url, "captcha.png")
image = Image.open("captcha.png")
text = pytesseract.image_to_string(image)
print(text)
time.sleep(2)
if __name__ == '__main__':
main()
这样子你可以通过图片和输出的文字,来看tesseract识别是否准备,虽然错误还是会有的,但是一般都是可以识别出来的。
测试图片:
识别结果为: