在写一个需要用到ORC的小工具,试了一下Tesseract,中文的效果差强人意,已弃坑,转用百度API,但是还是要做一下笔记。
准备
首先需在本机安装Tesseract客户端,然后安装pytesseract库:
pip install pytesseract
没安装过PIL的也要安装一下,因为所调用的第一个参数是由Image类返回:
pip install PILLOW
实例
import pytesseract
from PIL import Image
img = Image.open("D://aa.jpg")
text = pytesseract.image_to_string(img, lang="chi_sim")
print(text)