使用,就是可以把图片文字自动提取出来,然后识别图片
安装步骤:https://www.cnblogs.com/wenqiang-leo/p/13962265.html
备注:补充,按如上配置后会一直报错,原因是tesseract的tessdata库还要在继续的下载一个包
包的地址:
https://codechina.csdn.net/mirrors/tesseract-ocr/tessdata?utm_source=csdn_github_accelerator
将包解压缩后,存放在D:\tool-work\Tesseract-OCR\tessdata文件下
运行脚本就可以了
import pytesseract
from PIL import Image
image = Image.open(r'D:\pythonProject1\venv\lib\site-packages\pytesseract\1.jpg')#这里地址是指识别的图片地址
text = pytesseract.image_to_string(image,lang='chi_sim') #使用简体中文解析图片
print(text)