1.在linux系统中安装tesseract,按照以下命令逐步操作
sudo apt-get install tesseract-ocr
sudo apt-get install libleptonica # 会提示下面的信息
sudo apt-get install libtesseract-dev
sudo apt-get install tesseract-ocr-chi-sim
export TESSDATA_PREFIX=/usr/share/tesseract-ocr/tessdata/
正在读取软件包列表… 完成
正在分析软件包的依赖关系树
正在读取状态信息… 完成
没有可用的软件包 libleptonica,但是它被其它的软件包引用了。
这可能意味着这个缺失的软件包可能已被废弃,
或者只能在其他发布源中找到
然而下列软件包会取代它:
liblept5
E: 软件包 libleptonica 没有可安装候选
2.安装python库pytesseract
pip install pytesseract
3.编写代码,运行即可
import pytesseract
from PIL import Image
# 打开图片文件
image = Image.open('123.png')
# 调用Tesseract OCR库识别图片中的文字
text = pytesseract.image_to_string(image,lang='chi_sim')
# 打印识别结果
print(text)