Tesseract 是一个将图像翻译为文字的 OCR 库(光学识别系统, Optical Character Recognition)
1 安装:
Windows
https://code.google.com/p/tesseract-ocr/downloads/list
Linux平台
sudo apt-get install tesseract-ocr
mac平台
brew install tesseract
2 使用
(1) 在终端中调用:
tesseract test.jpg text
(2) 在python代码中使用:
安装python库
pip3 install pytesseract
from PIL import Image
import pytesseract
image = Image.open('test.jpg') # 读取图片
image.rotate(45).show() # 将图片旋转, 并用系统自带的图片工具显示图片
result = pytesseract.image_to_string(image) # 将图像转为文字
print(result)