1.安装pytesseract
安装 pytesseract 第三方库
pip install pytesseract
2.安装Tesseract-OCR,并配置环境变量
a.安装 Tesseract-OCR
官网安装: Home · UB-Mannheim/tesseract Wiki · GitHub
b.配置环境变量
变量名:TESSDATA_PREFIX
变量值:C:\Program Files (x86)\Tesseract-OCR (路径使用自己安装包的位置)
如上图所示:输入变量名和变量值,点击确定
点击 Path,新增环境变量 %TESSDATA_PREFIX%\tesseract.exe,点击确定,至此环境变量配置完成
3.修改 pytesseract 库中的pytesseract.py 文件中的tesseract_cmd变量
将 tesseract_cmd ='tesseract'
修改为
tesseract_cmd=r'C:\ProgramFiles(x86)\Tesseract-OCR\tesseract.exe' # 注意:这里的路径要取自己电脑的路径
4.编码实现图像识别功能
import pytesseract
from PIL import Image
def get_verification_code(pic)->str:
"""
pic:要识别的图片
返回识别的对象
"""
img=Image.open(pic)
# config = '--psm6',这是指定你有一个统一的文本块
text=pytesseract.image_to_string(image=img,lang='eng',config='--psm6')
Return text
运行结果:
识别图形验证码