【Python】图像文字识别：从图片中识别出文字（Pytesseract安装配置与使用）

最新推荐文章于 2025-02-20 10:09:40 发布

哞哞哞是Echo

最新推荐文章于 2025-02-20 10:09:40 发布

阅读量3k

点赞数 2

分类专栏： CV 文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/EchoooZhang/article/details/104927479

版权

【Python】图像文字识别：从图片中识别出文字（Pytesseract）

1.Tesseract

将图片翻译成文字一般被称为光学文字识别（Optical Character Recognition，OCR）。可以实现OCR 的底层库并不多，目前很多库都是使用共同的几个底层OCR 库，或者是在上面进行定制。
Tesseract 是一个OCR 库，目前由Google 赞助（Google 也是一家以OCR 和机器学习技术闻名于世的公司）Tesseract 是目前公认最优秀、最精确的开源OCR 系统。除了极高的精确度，Tesseract 也具有很高的灵活性。它可以通过训练识别出任何字体（只要这些字体的风格保持不变就可以），也可以识别出任何Unicode 字符。

2. 安装配置Pytesseract

在Python里你需要使用pytesseract，他是Tesseract关于Python的接口，可以使用pip install pytesseract安装。
但是可能会报错，因为你还需要下载Tesseract-OCR并为他配置环境变量。
Tesseract-OCR：
下载安装地址：可以百度直接搜就可以。
这里有我放在云盘里的安装包版本：
在这里插入图片描述
链接：

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。