在ubuntu20.10系统下实现一键OCR识别图片截图中的内容使之转换为文本可以复制粘贴

绝世这天下

已于 2022-04-11 10:10:58 修改

阅读量892

点赞数

分类专栏： linux系统文章标签： linux

于 2022-04-11 10:10:20 首次发布

本文链接：https://blog.csdn.net/weixin_52201738/article/details/124089409

版权

本文介绍了如何在Ubuntu 20.10系统下，通过gnome-screenshot截图和tesseract OCR软件，实现一键将图片中的文字转换成可复制的文本。详细步骤包括安装tesseract、编写处理OCR结果的shell脚本，以及设置快捷键以方便快速调用。

摘要由CSDN通过智能技术生成

目的:因为最近主要使用ubuntu系统,想要将视频中的文字提取出来,实现一键OCR识别图片截图中的内容使之转换为文本可以复制粘贴.

主要思路
利用截图软件gnome-screenshot 进行截取需要被文字识别的图片；
利用文字识别OCR软件tesseract，进行识别
将结果输出，复制到文件和剪切板

步骤1：安装依赖软件
安装tesseract
tesseract是一个开源的OCR引擎，最初是由惠普公司开发用来作为其平板扫描仪的OCR引擎，2005年惠普将其开源出来，之后google接手负责维护。目前稳定的版本是3.0。4.0版本加入了基于LSTM的神经网络技术，中文字符识别准确率有所提高。

添加源
sudo add-apt-repository ppa:alex-p/tesseract-ocr
更新源
sudo apt-get update

安装
sudo apt-get install tesseract-ocr

安装中文字库
tesseract支持60多种语言的识别不同，使用之前需要先下载对应语言的字库，下载地址：https://github.com/tesseract-ocr/tessd

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

绝世这天下

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

VMware中安装Ubuntu 20.10

11-15

939

创建新的虚拟机，选择经典模式选择要安装的Ubuntu 20.10 ISO镜像选择虚拟机类型为 Linux 定义虚拟机名称与存储位置修改虚拟磁盘大小点击Finish按钮完成创建虚拟机创建成功，点击Close按钮，随后将自动启动该虚拟机系统成功引导Ubuntu镜像，回车后进入安装界面在检测硬盘磁盘检测中磁盘检测完成，重启中提示移除安装媒体，然后回车进入Ubuntu桌面，安装界面加载中成功加载安装...

Ubuntu 20.10 更换镜像地址为阿里云镜像

01-09

2733

1.导入公钥 sudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys 3B4FE6ACC0B21F32 3B4FE6ACC0B21F32 3B4FE6ACC0B21F32 3B4FE6ACC0B21F32 2.修改/etc/apt/sources.list内容，全部替换为下面内容 deb http://mirrors.aliyun.com/ubuntu/ bionic main restricted universe mult...

参与评论您还未登录，请先登录后发表或查看评论

ubuntu复制粘贴快捷键_Linux系统（ubuntu）一键OCR识别图片截图文字转文本

weixin_39613540的博客

10-21

758

目的本文主要希望在ubuntu系统下实现一键OCR识别图片截图中的内容使之转换为文本可以复制粘贴主要思路利用截图软件gnome-screenshot 进行截取需要被文字识别的图片；利用文字识别OCR软件tesseract，进行识别将结果输出，复制到文件和剪切板本文附视频教程：ubuntu linux 下实现一键截屏截图OCR文字识别_哔哩哔哩 (゜-゜)つロ干杯~-bilibili步骤1：安装...

使用PaddleOCR在Ubuntu上实现一键截屏OCR提取文本

m0_63642362的博客

04-14

1116

使用PaddleOCR在Ubuntu上实现一键截屏OCR，最后输出识别文本

ubuntu下的ocr文字识别（pdf、tif等）

weixin_30542079的博客

09-27

267

平时使用扫描件或者pdf查看文档，但是在ipad上当文字比较小的时候不能有效放大，过着每次阅读需要移动屏幕，十分不方便，为此想将pdf或者图片中的文字截取出来，可以有效处理，当然需要ocr技术了，现在我们就来考虑和解决这个问题。1、技术准备：os为 linuxmint 13(基于ubuntu1204的）ocr软件：tesseract，执行文件为tesseract gocrpdf处理软件：pdfto...

Ubuntu系统进行OCR文字识别+latex公式识别

JeSuisDavid的博客

10-12

2192

目录前言Step1：安装tesseractStep2：制作Shell文件Step3：设置快捷键，一键调用shell脚本下面是Latex公式识别前言现在的工作重心慢慢往ubuntu上靠拢，所以在闲暇之余摸索一下ubuntu的小功能。如果在ubuntu上码字的话，尤其是写技术文档，OCR识别和公式识别应该会经常用到。自己也是折腾了好长时间，终于搞定了，分享记录一下过程。以下，enjoy！ Step1：安装tesseract tesseract是一个开源的OCR引擎，最初是由惠普公司开发用来作为其平板扫描仪

Ubuntu Kylin照片文字识别工具

weixin_44769702的博客

06-02

572

Ubuntu Kylin照片文字识别工具 **参加比赛做了一个Ubuntu系统下可运行的文字识别工具使用的语言是Java 可以打包在Windows下运行可以实现文字识别，翻译，PDF转换等功能** 已经在GitHub共享 [https://github.com/NUDT-Charlee/KylinOCR.git] ![这是主界面![](https://img-blog.csdnimg....

Ubuntu docker 20.10.12版本和docker-compose离线安装包

06-21

总之，这个资源包提供了一套完整的解决方案，使得在没有互联网连接的Ubuntu 20.10环境中也能顺利安装和使用Docker和Docker Compose，极大地便利了开发者和系统管理员的工作。在实际使用中，务必根据具体需求和系统...

Ubuntu 20.10 groovy 更换国内源

最新发布

奇妙的Bug之旅

12-23

382

在现代社会中，文字识别技术被广泛应用于各种场景，如自动化处理、文档数字化等。本文将介绍如何在Windows系统下搭建一个基于PaddleOCR的图片文字识别WebAPI，并详细列出所有步骤和相关代码片段。通过本实例，读者可以快速了解如何搭建一个实用的文字识别服务，并将其应用于实际项目中。接下来，我们将创建一个Flask应用来演示如何使用PaddleOCR进行图片文字识别。首先，我们需要安装PaddleOCR库到本地开发环境中。现在，我们将集成PaddleOCR库到我们的应用中。三、创建Flask应用。

Ubuntu16.04下-基于python的OCR实现

USTB人海的博客

03-26

1038

在ubuntu系统下利用python库实现简单的ocr.主要利用tesseract-ocr.下面先进行必要依赖库的安装sudo apt-get install libpng12-dev sudo apt-get install libjpeg62-dev sudo apt-get install libtiff5-dev sudo apt-get install gcc sudo apt-...

Ubuntu系统 OCR文字识别与 Latex公式识别

gene's blog

10-07

648

tesseract 是一个开源的OCR引擎，最初是由惠普公司开发用来作为其平板扫描仪的OCR引擎，2005年惠普将其开源出来，之后google接手负责维护。目前稳定的版本是3.0。4.0版本加入了基于LSTM的神经网络技术，中文字符识别准确率有所提高。

Ubuntu下安装编译tesseract-ocr并测试pytesseract

IT大头的博客

11-27

3797

网上有关tesseract-ocr如何安装编译的资料很多，但是总有一些问题出现，笔者也是在不停的摸索下安装成功，希望对大家有帮助

ubuntu 图片文字识别

qq_45212012的博客

09-29

958

ubuntu图片文字识别仅限个人学习所用安装我不详细讲，只说我踩的坑看源码图片的识别正确率不高，但是作为学习用应该够了仅限个人学习所用第一次用博客写东西，有点不习惯，如果我的代码存在什么错误，欢迎留言，互相探讨。安装我不详细讲，只说我踩的坑 1.安装完pillow-> tesseract -> pytesseract 后，一定要记得下载自己需要的需要包 2.tesseract自...

在ubuntu系统下如何使用python识别图片中的文字

xmy7007的博客

12-08

276

ubuntu系统使用python和tesseract对图片中的文字进行识别

ubunut20搭建离线OCR工具tesseract

nibuyaoshiwang的博客

01-05

267

【代码】ubunut20搭建离线OCR工具tesseract。

截图文字识别+翻译

默金

01-06

1227

截图文字识别+翻译 import pytesseract import requests,json,os from PIL import Image file_path=os.listdir("./pic") for i in file_path: path="./pic/"+i image = Image.open(path) vcode = pytesseract....

ubuntu20.10

08-18

Ubuntu 20.10 是 Ubuntu 的一个版本，如果你当前使用的是 Ubuntu 20.04，你可以通过升级来获得 Ubuntu 20.10。首先，你需要确保你的系统已经更新到最新的状态，然后你可以按照以下步骤进行升级： 1. 打开终端，输入以下命令来更新你的系统： ``` sudo apt update sudo apt upgrade sudo apt dist-upgrade ``` 2. 接下来，输入以下命令来安装升级工具： ``` sudo apt install update-manager-core ``` 3. 编辑 `/etc/update-manager/release-upgrades` 文件，确保 `Prompt` 行的值为 `normal`: ``` sudo nano /etc/update-manager/release-upgrades ``` 4. 运行以下命令来开始升级过程： ``` sudo do-release-upgrade ``` 5. 系统会提示你确认升级，按照提示操作并耐心等待升级完成。 6. 完成升级后，你的系统将会是 Ubuntu 20.10。请注意，在升级之前，确保备份重要的数据，并确认你的系统满足 Ubuntu 20.10 的系统要求。记得在升级过程中遵循系统的提示和警告。引用 [3123 #### 引用[.reference_title] - *1* *3* [Ubuntu 20.04 / 20.10 如何升级到 Ubuntu 21.04 ?](https://blog.csdn.net/xiaochong0302/article/details/127279802)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* [Ubuntu 20.10 正式发布：新特性亮点汇总](https://blog.csdn.net/zdhsoft/article/details/109391281)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]