python的PIL工具包是图像处理相关的工具包,其中包含很多非常方便的函数,pytesseract是对于文字识别的基础函数,对于文字的字体有一定的要求,对于非标准字体的识别正确率较低
from PIL import Image import pytesseract image = Image.open("timg1.png") code = pytesseract.image_to_string(image) print(code)
timg1.png
识别的文字
FIBCDEFISHIJKLIVI
NOPCIHSTUVVIXYZ
FIBCDEFGHIJKLM
NDPCIHSTUVVIXYZ
lE345S7BSCI