Python+Tesseract实现自己的OCR无限次识别(保姆级)

一晌小贪欢

已于 2023-04-23 13:34:10 修改

阅读量423

点赞数

分类专栏： OCR图片识别文字文章标签：爬虫 python 开发语言经验分享

于 2023-03-23 17:54:09 首次发布

本文链接：https://blog.csdn.net/weixin_42636075/article/details/129735279

版权

OCR图片识别文字专栏收录该内容

7 篇文章 0 订阅

订阅专栏

本文创建自己的OCR，实现无限次图片识别，没一个字废话

第 1 步、下载安装 Tesseract，官方链接：点我

在这里插入图片描述

第 2 步准备添加环境变量

在这里插入图片描述

添加好后，点击确定

在这里插入图片描述

第 3 步，下载语言包，默认不持支中文，中文包下载：点我

在这里插入图片描述

下载成功

在这里插入图片描述

下载慢的，或者下载不了的，能不能关注+收藏+点赞，然后我就会给你

重要的一步：

`下载完成后我们需要将文件内chi_sim.traineddata放到Tesseract的路径下的tessdata目录下`

在这里插入图片描述

实践出真知

在这里插入图片描述

库	安装
pytesseract	pip install pytesseract


import pytesseract
from PIL import Image

img = Image.open("img.png")
string = pytesseract.image_to_string(img, lang='chi_sim')
print(string)
print("----------------------------------------------------------------")
# print(path+img)

识别效果：“一坨屎”，垃圾

在这里插入图片描述

失望

我有后路

调用`百度OCR`的在这篇文章：点我

调用`OCRSpace`的在这篇文章：点我

希望对大家有帮助

致力于办公自动化的小小程序员一枚

致力于写出最清楚的博客

都看到这了，关注+点赞+收藏=不迷路！！

一晌小贪欢

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
Python+Tesseract实现自己的OCR无限次识别(保姆级)

Python+Tesseract实现自己的OCR无限次识别python图片转文字python识别图片
复制链接

扫一扫

专栏目录

Python+Tesseract实现自己的OCR无限次识别(保姆级)

本文创建自己的OCR，实现无限次图片识别，没一个字废话

第 1 步、下载安装 Tesseract，官方链接：点我

第 2 步准备添加环境变量

添加好后，点击确定

第 3 步，下载语言包，默认不持支中文，中文包下载：点我

下载成功

下载慢的，或者下载不了的，能不能关注+收藏+点赞，然后我就会给你

重要的一步：

下载完成后我们需要将文件内chi_sim.traineddata放到Tesseract的路径下的tessdata目录下

实践出真知

识别效果：“一坨屎”，垃圾

失望

我有后路

调用百度OCR的在这篇文章：点我

调用OCRSpace的在这篇文章：点我

希望对大家有帮助

致力于办公自动化的小小程序员一枚

致力于写出最清楚的博客

都看到这了，关注+点赞+收藏=不迷路！！

“相关推荐”对你有帮助么？

`下载完成后我们需要将文件内chi_sim.traineddata放到Tesseract的路径下的tessdata目录下`

调用`百度OCR`的在这篇文章：点我

调用`OCRSpace`的在这篇文章：点我