安装python的pillow 和 tesseract两个包:
pip install pytesseract
pip install pillow
运行下面的代码:
import pytesseract
from PIL import Image
img = Image.open('text.jpg') #提前准备test.jpg,需要识别的图片文件
text = pytesseract.image_to_string(img)
print(text)
tesseract 命令行使用方法
安装 tesseract 此处下载
https://tesseract-ocr.github.io/tessdoc/#binaries
得到一个二进制安装文件。(另注意文字识别库)
注意在环境变量添加tesseract的路径。
tesseract 5.png stdout -l chi_sim
tessaeract命令的参数解释:
- 5.png----需要识别的文件
- stdout----存放识别后的文本(输出文件txt格式)
- -l chi-sim ----识别语言 简体中文