图像识别篇-利用python对图片里的英文字母数字转换为文本

最新推荐文章于 2025-03-08 13:16:41 发布

GLL_

最新推荐文章于 2025-03-08 13:16:41 发布

阅读量4.2k

点赞数

分类专栏： Linux python 文章标签： linux Python 图像处理

本文链接：https://blog.csdn.net/rong11417/article/details/89007675

版权

Linux 同时被 2 个专栏收录

160 篇文章

订阅专栏

python

66 篇文章

订阅专栏

操作系统：ubuntu 16.04

python3版本：3.5.2

1、预装python模块te

1) sudo pip3 install pillow

安装PIL模块，在python2中有这个模块，在python3中需要安装pillow模块，这个模块包含了PIL模块

2) sudo pip3 install pytesseract

2、下载tersseract-ocr,在github的wiki有这个命令，地址：https://github.com/tesseract-ocr/tesseract/wiki

执行完这两个命令，它这里给的命令有点问题，应该是

sudo apt-get install tesseract-ocr

sudo apt-get install libtesseract-dev

下载完成

3、

创建一个python脚本，名为 pic_tostring.py

代码如下

#!/usr/bin/python3
# -*- coding: UTF-8 -*-

from PIL import Image
import pytesseract

text=pytesseract.image_to_string(Image.open('w.JPG'),lang='eng')
print(text)

4、准备一个带有字母的图片

5、运行

python3 pic_tostring.py

6、结果

结果可能不是很准确

参考：

https://blog.csdn.net/qiushi_1990/article/details/78041375

https://github.com/tesseract-ocr/tesseract/wiki

https://blog.csdn.net/huxiangen/article/details/78877444

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

GLL_

关注关注

0
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

Python，OpenCV使用KNN来构建手写数字及字母识别OCR

qq_40985985的博客

08-05

3711

这篇博客将介绍如何借助OpenCV提供的手写数字及字母数据集，来构建训练KNN模型，以进行手写数字及字母的识别。并分别达到手写数字 91% 的精确度，字母93%的精确度。提升模型精确度的方法有1）增加训练数据集以及 2）增加错误的数据集；

python识别图片中的文字、数值并转文档

阿黎逸阳的博客

11-20

5888

应用python把图片中的文字和数值识别出来，存储成相应的文档。

参与评论您还未登录，请先登录后发表或查看评论

python图片找字_如何用python查找图像中的字母

weixin_29729247的博客

01-12

1658

字母似乎总是在数字的末尾。如果这是真的，您可以采用更简单的方法：找到所有轮廓创建边界框列表(即每个轮廓对应一个框)确定哪一个是最右边的边界框使用所有其他框的(x，y，width，height)信息来创建一个ROI并只裁剪数字Python 2.7和opencv2.4的源代码：import cv2### load input image and convert it to grayscaleimg =...

python数字转字符串

weixin_34365417的博客

10-02

374

参考文献： tt=322 tem='%d' %tt 可用，已经试用转载于:https://www.cnblogs.com/Wanggcong/p/7620225.html

python识别图片中的所有数字内容

热门推荐

linxinfa的专栏

04-25

2万+

环境准备： (1) python版本3.x (2) 安装tesseract-ocr，下载地址： https://digi.bib.uni-mannheim.de/tesseract/ (3) 配置环境变量：C:\Program Files\Tesseract-OCR (4) 编辑文件 C:\Users\Administrator\AppData\Local\Programs\Python\Pyth...

如何利用Python识别图片中的文字

09-16

### 如何利用Python识别图片中的文字 #### 一、引言在日常工作中，经常会遇到无法直接复制文本的情况，例如某些网页或文档中的内容仅能通过截图的方式保存。这种情况下，若想重用这些文本信息，则需手动输入，效率...

python手写字母识别_机器学习--kNN算法识别手写字母

weixin_39753747的博客

12-05

1670

本文主要是用kNN算法对字母图片进行特征提取，分类识别。内容如下：kNN算法及相关Python模块介绍对字母图片进行特征提取kNN算法实现kNN算法分析一、kNN算法介绍K近邻(kNN，k-NearestNeighbor)分类算法是机器学习算法中最简单的方法之一。所谓K近邻，就是k个最近的邻居的意思，说的是每个样本都可以用它最接近的k个邻居来代表。我们将样本分为训练样本和测试样本。对一个测试样本 ...

使用python 对验证码图片进行降噪处理

09-18

在本文中，我们将探讨如何使用Python对验证码图片进行降噪处理。...通过对验证码图片的降噪处理，我们可以更好地理解和利用这些图像数据，这对于自动化处理、机器学习以及人工智能等领域具有重要意义。

python识别图像并提取文字的实现方法

12-25

前言 python图像识别一般基础到的就是tesseract了，在爬虫中处理验证码广泛使用。安装安装教程网上大都差不多，Windows下确实比较麻烦，涉及到各种路径、环境变量甚至与linux不同的路径分隔符，所以这里的安装是基于Centos7。 1. 依赖安装 yum install -y automake autoconf libtool gcc gcc-c++ 2. 安装leptonica Leptonica主要用于图像处理和图像分析原则上所有的库文件都是可以直接用yum安装的，如果想要具体的某个版本，可以前往官方源下载对应版本然后按照对应方式编译 wget http://ww

python数字字母识别_字符图像识别——数字字母混合

weixin_33817140的博客

02-10

2695

需要识别的验证码图像，其中包含 4 个字符(数字字母)思路灰度化：将图像转为灰度图像，即一个像素只有一种色阶(有 256 种不同灰度)，值为 0 表示像素最黑，值为 255 表示像素最白。二值化：将图像转为黑白图像，即一个像素只有黑白两种状态，不是黑就是白，没有灰色，值为 0 表示像素最黑，值为 1 表示像素最白.图像转字符串：利用工具将图像中的字符串识别出来前面两步都是对图像进行识别前处理，目的...

python识别图片数字、汉字、英文

qq_45746739的博客

04-14

1642

tesseract的安装及使用

Python 将数字写入到一个文本文件

qq_40518671的博客

07-15

1万+

import random with open("2.txt","w") as f: for i in range(5): number=random.randint(1,50) text=f.write(str(number)+"\n") print(text) f.close()

python怎么识别图片上的字_python如何识别图片中的文字

weixin_39719989的博客

12-03

457

python如何识别图片中的文字，这里给个案例并附上详细步骤：模块包的安装：1、安装PIL：pip install Pillow2、安装pytesser3：pip install pytesser33、安装pytesseract：pip install pytesseract4、安装autopy3：先安装wheel：pip install wheel下载autopy3-0.51.1-cp36-cp...

超简单使用Python识别图片中的中/英文字/包含工具下载链接

feengg的博客

03-23

2699

摘要: 最近闲来无事, 使用Python写了个文字识别的程序, 在这里分享给大家 1. 准备工作申请百度开发者平台, 获取图片文字识别, 申请地址: https://console.bce.baidu.com/ai/?_=1553338619822&fromai=1#/ai/ocr/overview/index 申请效果如下所述: 2. 配置依赖库...

python实现OCR识别

James_bobo的博客

07-27

1万+

OCR英文全称是Optical Character Recognition，中文叫做光学字符识别。它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来，并转换成一种计算机能够接受、人又可以理解的格式。下面调用百度API进行识别： from aip import AipOcr APP_ID = "10739584" API_KEY = "RQTE6EpB6y4OXUA2iNKyPMhR" SECRET_KEY = "ibD0O15GOC949V2V16nwOkZZcVdwObcw" client

【Python-Opencv】KNN英文字母识别

人家

04-20

8229

特征集分析数据集为letter-recognition.data，一共为20000条数据，以逗号分隔，数据实例如下所示，第一列为字母标记，剩下的为不同的特征。 T,2,8,3,5,1,8,13,0,6,6,10,8,0,8,0,8 学习方法 1、读入数据，并去除分隔号2、将数据第一列作为标记，剩下的为训练数据3、初始化分类器并利用训练数据进行训练4、利用测试数据验证准确率

图像处理技术在汉字与英文字符识别中的应用

- Python：由于其丰富的图像处理库（如OpenCV、Pillow）和深度学习框架（如TensorFlow、PyTorch），Python成为实现图像识别项目的热门选择。 - C/C++：提供较高的执行效率，适用于对运行速度要求较高的场合。 - Java...