两行代码搞定python OCR图像文字识别

最新推荐文章于 2024-04-16 11:20:50 发布

暮之雪

最新推荐文章于 2024-04-16 11:20:50 发布

阅读量4.5k

点赞数

分类专栏： tesseract 文章标签： tesseract

本文链接：https://blog.csdn.net/u013090676/article/details/88740415

版权

tesseract 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

目前OCR主要依赖几个低层库，本博客采用Tesseract，Tesseract是由Google维护的开源OCR。本博客在windows环境进行，linux环境同理。

1、安装Tesseract：

windows下Tesseract的安装比较简单，下载exe然后一直next下去就行了。但是由于要做中文的识别，所以一定在安装的时候要勾选相应的中文库，这个安装时是默认不下载的。

2、安装pytesseract

pytesseract是对tesseract做的一层Python API封装。

pip3 install pytesseract

3、编写py代码：

import pytesseract
from PIL import Image

pytesseract.pytesseract.tesseract_cmd = 'D://ocr/Tesseract-OCR/tesseract.exe'
text = pytesseract.image_to_string(Image.open('D://ocr/qximg/test1.png'),lang='chi_sim')

首先导入相应的库。第一行代码从正确的位置引入tesseract运行文件。第二行代码选择要识别的图片，设置简体中文识别。text即为图片中中文的内容。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

暮之雪

关注关注

0
点赞
踩
24

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

pyocr，一个超酷的Python库！

黑马非马的博客

08-08

1511

pyocr 是一个用于光学字符识别（OCR）的 Python 库，它提供了一个简单的接口，允许开发者将图片中的文本提取出来。

python OCR识别

07-03

OCR 识别

参与评论您还未登录，请先登录后发表或查看评论

OCR图片识别

周世文的博客

08-15

2615

简单识别验证码代码： public static void ocr(String fileName){ File filepicF = new File(fileName); Ocr.setUp(); // one time setup Ocr ocr = new Ocr(); // create a new OCR engine ocr.startEngin

基于python的OCR字符识别

apollo_miracle的博客

08-09

7703

1 基本环境操作系统：win10 64位系统 python版本：3.6 2 安装配套环境（1）首先安装OCR字符识别库Tesseract 下载网址：https://digi.bib.uni-mannheim.de/tesseract/ 下载下图对应的版本（如下图所示）下载后双击进行安装，在这里（如下图）要根据需求在安装界面进行语言勾选，展开Additional lang......

C#使用PaddleOCR进行图片文字识别✨

最新发布

mingupup的博客

04-16

3151

本文介绍了在C#中如何基于PaddleOCR进行图片文字识别。

python识别数字验证码_Python3使用tesserocr识别字母数字验证码

weixin_39664774的博客

12-03

297

一、背景最近有个需求是从一个后台的留言网站爬取留言数据，后台管理网站必然涉及到了登录，登录就有个验证码的问题必须得解决，由于验证码是从后端生成的，并且不了解其生成规则，那就只能通过图像识别技术来做验证码识别了！通过查阅资料发现Python中的的tesserocr这个库好像使用的比较多，所以对这个库进行了一番研究，并且实现了那个后台网站验证码的识别。二、准备工作1. 安装tesserocr由于我使用...

python屏幕文字识别_学会python就是如此任性，15行代码搞定图片文字识别，附源码...

weixin_39886205的博客

11-23

1850

python作为一门高级编程语言，它的定位是优雅、明确和简单。阅读Python编写的代码感觉像在阅读英语一样，这让使用者可以专注于解决问题而不是去搞明白语言本身。Python虽然是基于C语言编写，但是摒弃了C中复杂的指针，使其变得简明易学。并且作为开源软件，Python允许对代码进行阅读，拷贝甚至改进。这些性能成就了Python的高效率，有“人生苦短，我用Python”之说，是一种十分精彩又强大的...

Python3一行代码实现图片文字识别

Python宋宋的专栏

09-15

893

解压安装tesseract-ocr后做如下操作，就可以支持中文识别了。下面就来讲讲这几个库的安装，因为只有这几个库安装好以后Python才能实现一行代码实现图片文字识别。这样就能成功安装pytesseract，安装PIL只需要在上面第三步里搜索PIL并点击安装即可。至此我们所有的配置就完成了，运行下面代码就可以把杜甫的登高这首图片诗解析成文字了。我们运行代码后识别的结果，有几个字没有正确识别，但是大多数字都能识别出来。会报下面错误，错误原因是：没有安装识别引擎tesseract-ocr。

python游戏图像识别_利用python做图像识别

weixin_39969257的博客

12-16

4120

Python验证码识别处理实例(转)一、准备工作与代码实例1、PIL、pytesser、tesseract(1)安装PIL：下载地址：http://www.pythonware.com/products/pil/(CSDN下载)下载后是一个exe，直接双击安装，它会自动安装到C:\Python27\Lib\site-packa...文章developerguy2016-03-13986浏览量深度学...

python图像识别与提取_python图像识别与提取

weixin_39600400的博客

11-21

6530

广告关闭腾讯云11.11云上盛惠，精选热门产品助力上云，云服务器首年88元起，买的越多返的越多，最高返5000元！从机器学习的的角度来说，首先要提取图片的特征，将这些特征进行分类处理，训练并建立模型，然后在进行识别。但是让计算机去区分这些图片分别是哪一类是很不容易的，不过计算机可以知道图像的像素值的，因此，在图像识别过程中，通过颜色特征来识别是相似图片是我们常用的（当然还有其特征还有纹理特征、...

python实现简单的图片文字识别脚本

Warm-hearted

01-21

2365

我们都知道，部分电子版的书籍是以扫描图片的形式展现的，在阅读过程中无法选取文字。对于平时有记录习惯的人来说，无法复制黏贴真的很不爽！为了解决这个问题，需要这样一个脚本，他有下面这些功能： 1、能够实现自由截图 2、能够识别含有文字的截图 3、将识别出的文字输出到剪切板大致上需要的东西非常明确，那么，一个一个的来~ 截图截图作为一项非常实用的功能，自然是有各种各样的实现，在这里考虑使用python去完成这个任务，那么自然是先google一下，网上一搜，果然资料多到爆炸~ 不出所料，python对截图功能

Python，OpenCV使用KNN来构建手写数字及字母识别OCR

qq_40985985的博客

08-05

3514

这篇博客将介绍如何借助OpenCV提供的手写数字及字母数据集，来构建训练KNN模型，以进行手写数字及字母的识别。并分别达到手写数字 91% 的精确度，字母93%的精确度。提升模型精确度的方法有1）增加训练数据集以及 2）增加错误的数据集；

python ocr 识别中文pdf_pytesseract识别PDF文件中的文字（OCR）

weixin_39966053的博客

12-08

1158

前言：由于要利用一些比较老的文献中的数据，手工输入费时费力，于是乎找到了下面的方法。如果不差钱可以使用Adobe Acrobat Reader中的文字识别，也可以尝试其中的试用版。下面的方法完全室开源免费的方式。1. 准备工作：安装程序、软件包、配置环境变量平台：win10, python 3.7.3, spyder3.3.3安装软件包(用conda)：pdf2image, pytesserac...

python读取图片文字为表格_python-使用百度AipOcr实现表格文字图片识别

weixin_39635432的博客

11-21

382

代码运行环境：win10 python3.7需要aip库，使用pip install baidu-aip即可（1）目的通过百度AipOcr库，来实现识别图片中的表格，并输出问表格文件。（2）实现1 #encoding: utf-82 importos3 importsys4 importrequests5 importtime6 importtkinter as tk7 from tkinter...

OCR入门教程系列（五）：OCR实战代码解析

专注大数据与人工智能技术分享，欢迎私信加群互相学习！

04-13

1万+

OCR文本识别实战📝导读：在上一篇文章中我们对文字识别算法理论部分进行详细总结，本篇将继续介绍文字识别CRNN网络实战部分，下面将从CRNN实践代码出发进一步说明文字识别实战流程。本系列目录： 1️⃣OCR系列第一章：OCR文字识别技术总结（一） 2️⃣OCR系列第二章：OCR文字识别技术总结（二） 3️⃣OCR系列第三章：OCR文字识别技术总结（三） 4️⃣OCR系列第四章：OCR文字识别技术总结（四） 5️⃣OCR系列第五章：OCR文字识别技术总结（五） ......

php动态加载html,php读取动态页面生成静态html文件的方法

weixin_36317317的博客

03-10

295

该楼层疑似违规已被系统折叠隐藏此楼查看此楼为了服务器安全着想，所以把allow_url_fopen关掉了。当服务器allow_url_fopen = Off 时，就不能用file_get_contents，只有设置ＯＮ时可以用。$getstr=file_get_contents("http://www.163.com/weatherxml/54511.xml");$qx=explode("\""...

python用ocr技术识别_python学习之路（八）：牛刀小试，使用OCR技术识别图片文字...

weixin_39798943的博客

12-10

使用OCR技术识别图片里面的文字，当然我是没这个技术了，不过好在python有丰富的第三方模块，我门可以使用第三方模块来进行文字识别。在这篇文章中我采用百度提供的文字识别模块来写这个脚本。使用百度的文字识别，需要百度提供的APP_ID 、API_KEY、SECRET_KEY 。这三个信息只需要登录百度云创建一个应用即可。登录百度云：https://cloud.baidu.com/进入控制台在上面的...

Python人工智能识别文字内容（OCR）