python识别图像中的文字_使用 Python 识别并提取图像中的文字

最新推荐文章于 2024-06-21 18:03:42 发布

weixin_39701861

最新推荐文章于 2024-06-21 18:03:42 发布

阅读量340

点赞数

文章标签： python识别图像中的文字

1. 介绍

介绍使用 python 进行图像的文字识别，将图像中的文字提取出来，可以帮助我们完成很多有趣的事情。

2. 必备工具

tesseract-ocr

tesseract-ocr 是一个开源的图片OCR识别库，功能及其强大，支持多国语言。

更高级的用法，它还支持机器学习算法，通过训练的方式，使OCR识别更加智能化及准确。

python 库

使用安装 pytesseract 和 pillow 库：

pip install pytesseract

pip install pillow

3. 开发使用

使用 python 配合 tesseract 识别文字中的图像可以非常简单，几行代码就可以搞定。

例如，识别下面这张图片：

首先导入 pytesseract 和 pillow 库

import pytesseract

from PIL import Image

然后指定 tesseract 目录：

pytesseract.pytesseract.tesseract_cmd = 'f:/tessert/tesseract.exe'

然后使用 pillow 库加载图片：

img = Image.open('test.png')

最后使用 tesseract 识别图像的文字:

text = pytesseract.image_to_string(img, lang='chi_sim')

print(text)

最后的结果是：

可以看到，有偏差，但是基本上都识别出来了。

4. 总结

这里只是入门级的介绍，当然还有问题，比如彩色图像识别一般效果不好，对比度低的图像识别也不一定好，这就需要我们对图片进行处理后再来识别。比如提取灰度图片，锐化图片等操作，具体涉及到的是数字图像处理的领域了，这个后面有机会再讨论。

weixin_39701861

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python识别图像中的文字_使用 Python 识别并提取图像中的文字

1. 介绍介绍使用 python 进行图像的文字识别，将图像中的文字提取出来，可以帮助我们完成很多有趣的事情。2. 必备工具tesseract-ocrtesseract-ocr 是一个开源的图片OCR识别库，功能及其强大，支持多国语言。更高级的用法，它还支持机器学习算法，通过训练的方式，使OCR识别更加智能化及准确。python 库使用安装 pytesseract 和 pillow 库：pip ...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。