python从图片中提取文字_IT业界：3行代码，即可用Python从图片中提取文本！

最新推荐文章于 2024-07-10 03:47:45 发布

weixin_39778393

最新推荐文章于 2024-07-10 03:47:45 发布

阅读量525

点赞数

文章标签： python从图片中提取文字

在您开始之前，在你的计算机将需要Python，但您可能不需要下载它。首先检查(在命令行窗口输入python)有没有安装Python!如果你看到了一个Python解释器的响应，那么就能在它的显示窗口中得到一个版本号。通常较新的版本都可以做到Python的向前兼容。

关注我，每天用Python做一件有趣的事，掌握一些实用的技巧。

在这篇短文中，将向你展示如何使用Python的强大功能从图像中提取文本。这种技术的应用是无止境的。这个技术可以用到以下例子中：

机器学习项目的数据挖掘

拍摄收据并阅读处理内容

第一步：设置Python库

为了解决这个问题，我们将使用一个名为Python Tesseract的库。从图书馆网站：

Python tesseract是Python的一个光学字符识别(OCR)工具。也就是说，它将识别并“读取”嵌入图像中的文本。

Python tesseract是Google tesseract OCR引擎的包装器。它还可用作tesseract的独立调用脚本，因为它可以读取Pillow和Leptonica图像库支持的所有图像类型，包括jpeg、png、gif、bmp、tiff等。此外，如果用作脚本，Python tesseract将打印识别的文本，而不是将其写入文件。

第二步：准备工作

在设置要使用的Python库时，通常是一个单步过程。然而，对于PyTesseract，我们需要做两件事：

安装Python库

安装Tesseract应用程序

首先，要安装Python库，只需打开命令行窗口并键入：

pip install pytesseract

然后，可通过Github项目地址：https://github.com/UB-Mannheim/tesseract/wiki，下载并安装Tesseract OCR可执行文件。

在撰写本文时，我使用的是在2020-03-28年编译的64位Alpha Build v5.0.0。

我们需要知道在哪里安装，因为我们需要让你的python脚本知道。

如果你完成了上面的步骤，你就可以开始了。

第三步：编写Python代码

正如所开头说的那样，使用3行代码，您将能够从图片中读取文本：

import pytesseract

pytesseract.pytesseract.tesseract_cmd = r'C:\\Program Files\\Tesseract-OCR\\tesseract'

print(pytesseract.image_to_string(r'D:\\examplepdf2image.png'))

总结

简单的三步就能从图片中提取文本，这是现在很多手机新品发布中，都会提及的特色卖点，通过拍照来识别文字。

看完了文字就赶紧自己去练手吧~从今天开始，我将每天给大家分享一个Python技巧，欢迎大家持续关注我哦~

Python是一种计算机程序设计语言。是一种面向对象的动态类型语言，最初被设计用于编写自动化脚本(shell)，随着版本的不断更新和语言新功能的添加，越来越多被用于独立的、大型项目的开发。

weixin_39778393

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
python从图片中提取文字_IT业界：3行代码，即可用Python从图片中提取文本！

在您开始之前，在你的计算机将需要Python，但您可能不需要下载它。首先检查(在命令行窗口输入python)有没有安装Python!如果你看到了一个Python解释器的响应，那么就能在它的显示窗口中得到一个版本号。通常较新的版本都可以做到Python的向前兼容。关注我，每天用Python做一件有趣的事，掌握一些实用的技巧。在这篇短文中，将向你展示如何使用Python的强大功能从图像中提取文本。这种...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。