在ubuntu系统下如何使用python识别图片中的文字

最新推荐文章于 2024-06-02 23:10:14 发布

xmy7007

最新推荐文章于 2024-06-02 23:10:14 发布

阅读量196

点赞数

分类专栏： python 文章标签： ubuntu python linux

本文链接：https://blog.csdn.net/xmy7007/article/details/134871445

版权

python 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

1.在linux系统中安装tesseract，按照以下命令逐步操作

sudo apt-get install tesseract-ocr
sudo apt-get install libleptonica # 会提示下面的信息
sudo apt-get install libtesseract-dev
sudo apt-get install tesseract-ocr-chi-sim
export TESSDATA_PREFIX=/usr/share/tesseract-ocr/tessdata/

正在读取软件包列表… 完成
正在分析软件包的依赖关系树
正在读取状态信息… 完成
没有可用的软件包 libleptonica，但是它被其它的软件包引用了。
这可能意味着这个缺失的软件包可能已被废弃，
或者只能在其他发布源中找到
然而下列软件包会取代它：
liblept5
E: 软件包 libleptonica 没有可安装候选

2.安装python库pytesseract

pip install pytesseract

3.编写代码，运行即可

import pytesseract  
from PIL import Image  
  
# 打开图片文件  
image = Image.open('123.png')  
  
# 调用Tesseract OCR库识别图片中的文字  
text = pytesseract.image_to_string(image,lang='chi_sim')  
  
# 打印识别结果  
print(text)