ubuntu 安装 pytesseract 模块进行图片内容识别

最新推荐文章于 2024-08-26 16:41:57 发布

breeze_csdn

最新推荐文章于 2024-08-26 16:41:57 发布

阅读量622

点赞数

分类专栏： Image algorithm

原文链接：https://www.cnblogs.com/wanghuixi/p/12230224.html

版权

Image algorithm 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

主要是实现图片内容的离线识别，python 提供了一个库完成此功能。

一. 安装 tesseract-ocr 包

sudo apt-get install tesseract-ocr

二. 安装 PIL PIL(python imaging library)是python中的图像处理库

 sudo apt-get install python-imaging

三. 安装 pytesseract

pip install pytesseract

四.代码测试

复制代码

# -*- coding: UTF-8 -*-
from PIL import Image
import pytesseract
# 识别中文
text = pytesseract.image_to_string(Image.open('chinese.png'),lang='chi_sim')
print text

# 识别英文
text = pytesseract.image_to_string(Image.open('english.png'))
print text

复制代码

五.要想识别的中文需要添加中文字库

需要在ubuntu 系统中找到 tessdata 文件夹把中文字库放进去

也可以在线安装中文字库

sudo apt-get install tesseract-ocr-chi-sim

六.此模块还支持命令行识别

复制代码

使用命令：
识别英文：
tesseract e.png 1   #1 是存储获取内容的文件，会在本地生成一个1文件
识别中文
tesseract --help  # 查看帮助
tesseract --list -langs  # 查看是否安装了中文库chi_sim
tesseract -l chi_sim c.png 1 # 1也是结果的文件把识别的结果存到此文件中

复制代码

还可以离线安装源码编译安装参考的教程

https://www.cnblogs.com/yanhai307/p/10791490.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

breeze_csdn

关注关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

在Ubuntu16.04中使用pytesseract对图片进行识别

m0_51674710的博客

09-22

415

在Ubuntu16.04中使用pytesseract对图片进行识别，并搭建Flask服务器一、所需python库和工具工具备注 tesseract 4.1.1 python 3.7 pip 21.2.4 pytesseract 内置库 flask 内置库/常见web框架 PIL 用于图片处理的库二、安装库使用的命令和检查是否成功安装 1.tesseract4.1.1 tesseract从三版本以上就没有完整的在linux中使用的安装包安装所需的依赖 su

ubuntu 下安装 face_recognition

qls_147的博客

10-16

982

经过两天的不懈努力，踩了很多个坑，终于在ubuntu-22.04装上了face_recognition！！主要是dlib难搞，翻了好多博客，都没能成功，因为大多都比较久了…希望这是你参考的最后一篇~

参与评论您还未登录，请先登录后发表或查看评论

python图片内容识别_ubuntu 安装 pytesseract 模块进行图片内容识别

weixin_42421710的博客

01-14

379

主要是实现图片内容的离线识别，python 提供了一个库完成此功能。一. 安装 tesseract-ocr 包sudo apt-get install tesseract-ocr二.安装 PIL PIL(python imaging library)是python中的图像处理库sudo apt-get install python-imaging三. 安装 pytesseractpip in...

Ubuntu 安装 tesseract5 和 leptonica

最新发布

jhgj56的博客

08-26

380

通过这些步骤,您就可以在 Ubuntu 系统上成功安装 Tesseract 5.x 版本和 Leptonica 库了。如果需要在 Python 脚本中使用 Tesseract,可能还需要设置环境变量。如果需要其他语言数据包,可以运行: 将。替换为相应的语言代码,如。

ubuntu中pytesseract 安装与使用示例

weixin_30933531的博客

09-16

769

1. 安装 tesseract-ocr 包安装方法： sudo apt-get install tesseract-ocr 2. 安装 PIL PIL(python imaging library)是python中的图像处理库安装方法： sudo apt-get install python-imaging 3. 安装 pytesseract 安装方...

Ubuntu下安装编译tesseract-ocr并测试pytesseract

IT大头的博客

11-27

3847

网上有关tesseract-ocr如何安装编译的资料很多，但是总有一些问题出现，笔者也是在不停的摸索下安装成功，希望对大家有帮助

Tesseract pytesseract的安装和使用

weixin_30822451的博客

02-07

358

Tesseract是开源的OCR引擎，可以识别的图片里的文字，支持unicode（UTF-8）编码，100多种语言，需要下载相应语言的训练数据。安装：有两种方法，一种是通过编译源码，比较麻烦。我使用的是另外一种方法，在windows下，使用编译好的二进制文件。安装文件下载地址：https://sourceforge.net/projects/tesseract-ocr-alt...

python3使用Pillow、tesseract-ocr与pytesseract模块的图片识别的方法

09-17

### Python3 使用Pillow、Tesseract-OCR与Pytesseract模块进行图片识别 #### 一、简介在当今数字化时代，图像识别技术被广泛应用在各个领域，如自动驾驶、安防监控、医疗诊断等。而在文本识别方面，OCR（Optical ...

python批量识别图片指定区域文字内容

01-20

需要注意的是，`pytesseract`的识别效果可能受图片质量、字体、文字排列等因素影响，为了提高识别准确率，可以预先对图片进行预处理，如灰度化、二值化等操作。另外，如果对识别精度有更高要求，可以考虑使用云服务...

pytesseract模块下载

05-10

安装完成后，你可以在 Python 代码中使用 pytesseract 模块进行 OCR 识别。在使用前，你需要先导入 pytesseract 模块： ```python import pytesseract ``` 然后，使用以下代码即可进行 OCR 识别： ```python text...

在Ubuntu中实现人脸识别登录的完整步骤

09-14

主要给大家介绍了关于在Ubuntu中实现人脸识别登录的完整步骤，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面来一起学习学习吧

ubuntu16.04 --- tesseract安装教程

qq_33622849的博客

12-23

694

(1)If they are not already installed, you need the following libraries (Ubuntu 16.04/14.04) sudo apt-get install g++ # or clang++ (presumably) sudo apt-get install autoconf automake libtool

Ubuntu16.04 下编译安装tesseract 4.00.00alpha 及测试

Spaceack的专栏

12-01

254

tesseract 被译作四次元立方体；超正方体，它是一款开源的OCR图片识别工具，支持多种语言，对简单的验证码识别有较好的效果~ 3.05.01 及以后的版本没有Linux的二进制包,需要编译安装. # 安装相关组件 sudo apt-get install g++ # or clang++ (presumably) sudo apt-get install autoconf automake libtool sudo apt-get install autoconf-archive sudo ap

使用Ubuntu做图像识别以及机器学习过程中遇到的问题及解决方法

qq_45415920的博客

03-09

4763

目录网络问题科学上网换源python环境冲突使用anacondapython注意事项OpenCV库的问题网络问题在Linux系统里，配置环境有90%的报错都是因为网络问题。科学上网由于我国的某些原因，导致很多东西下载不了或者是速度特别慢，那这时候就需要科学上网来解决问题了，开全局能解决很多网站上不去的问题。懂的都懂，不多说。换源如果以上方法实现不了，那么就要尝试用国内的镜像源，如清华源、阿里源等。使用镜像源有两个方法，一个是在系统中修改默认源，另一个是用浏览器下载文件后在本地安装，两个方法各有优

linux(ubuntu)人脸图片识别配置与实现

HHHSSD的博客

08-18

495

代码分析： #include <stdio.h> #include <curl/curl.h> #include <string.h> #include <stdlib.h> #include <sys/types.h> #include <unistd.h> #include <sys/types.h> #include <sys/stat.h> #include <fcntl.h> ...

【聆思CSK6 视觉AI开发套件试用】Ubuntu 环境下 AI 图像识别体验

weixin_47569031的博客

02-15

502

本篇文章来自极术社区与聆思科技组织的CSK6 视觉AI开发套件活动，更多开发板试用活动请关注极术社区网站。作者：[Papalimo]

图像识别学习0-1 windows安装linux ubuntu16.04 双系统

liyuanba2dai的博客

10-16

205

序：最近准备学习人工智能图像识别，正好跟着一位大拿学习，后面会有一系列文章，让我们一块学习吧。 windows安装linux ubuntu16.04 双系统 1.首先制作u盘启动--用软碟通将系统镜像写入 U 盘（1）下载ubuntu16.04镜像。（2）下载并安装打开软碟通，点击使用即可，插上 U 盘，4G的U盘就可以，空白u盘。（3）进入软碟通，切换到ubuntu...

win10,ubuntu18.04系统下图像识别YOLOv5菠萝_附菠萝数据集图片标签

没有最好，只有更好

05-06

1449

yolov5识别物体（复现代码）教学视频https://www.bilibili.com/video/BV1jy4y1g7Ln 下面的教程是在win10系统下运行的，但其实跑这种深度学习的代码应该是用Ubuntu18.04系统比较好，因为Ubuntu安装环境没有win10那么麻烦，而且后面如果想搞其他机器人，一般会用到ROS，ROS不支持win系统。所以实在觉得在win10安装环境很麻烦就换Ubuntu系统下载yolov5到本地（不能中文路径）官方链接下面也有教程，yolov5: YOLOv5 🚀