用 Python 将图像转换为文本

最新推荐文章于 2024-05-22 15:44:18 发布

Q shen

最新推荐文章于 2024-05-22 15:44:18 发布

阅读量1k

点赞数

分类专栏： Python 教程文章标签： python 开发语言 windows

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_52010446/article/details/130681728

版权

Python 教程专栏收录该内容

222 篇文章 0 订阅 ¥299.90 ¥399.90

订阅专栏

超级会员免费看

本文介绍如何使用Python的pytesseract库和Tesseract OCR引擎将包含文本的图像转换回文本。首先需要在Windows上安装Tesseract OCR，并设置环境变量。接着，通过导入pytesseract和PIL库，打开图像文件，调用image_to_string函数来提取并打印图像中的文本。

摘要由CSDN通过智能技术生成

今天的博客文章涉及我一直很好奇的内容 -光学字符识别，也称为 OCR。虽然 OCR 是一个专门的主题，但我的主要重点是一个简单的应用程序：将本质上是图像的文本屏幕截图转换回文本。

为实现这一目标，我们将利用Tesseract OCR 引擎的强大功能。最初由惠普开发的专有软件，后来作为开源软件发布，现在由谷歌维护。

对于像我这样使用 Windows 的用户，您需要使用 Tesseract Installer for Windows安装 Tesseract OCR 引擎。安装程序可以位于此页面上。请记住将 PATH 环境变量设置为您的安装位置。

现在让我们开始讨论代码。我们首先导入两个基本库：

import pytesseract
from PIL import Image

pytesseract 是 Tesseract OCR 引擎的 Python 包装器。它使用了将不同类型的文档（包括扫描的纸质文档、PDF 文件甚至图像）转换为文本的魔法。

PIL（或 Pillow 在这种情况下）是一个 Python 库，允许您打开、修改和保存许多不同的图像文件格式。对于此脚本，我们使用图像模块打开图像文件。

为了处理我们要使用的图像，我们添加：

img = Image

了解本专栏

超级会员免费看

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
用 Python 将图像转换为文本

虽然 OCR 是一个专门的主题，但我的主要重点是一个简单的应用程序：将本质上是图像的文本屏幕截图转换回文本。它使用了将不同类型的文档（包括扫描的纸质文档、PDF 文件甚至图像）转换为文本的魔法。这也许是我能想到的最简单的例子来展示 OCR 的功能。它只是打开一个图像，利用 pytesseract 库读取图像的文本内容，然后打印出提取的文本。为实现这一目标，我们将利用Tesseract OCR 引擎的强大功能。这一行指定了“tesseract.exe”文件的路径，这是实际执行 OCR 过程的魔法。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Q shen 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。