tesseract-OCR下载安装及语言库下载

最新推荐文章于 2024-07-08 09:38:15 发布

土豆是大傻子

最新推荐文章于 2024-07-08 09:38:15 发布

阅读量3k

点赞数 3

分类专栏：笔记文章标签： python

本文链接：https://blog.csdn.net/qq_54117439/article/details/119645864

版权

笔记专栏收录该内容

1 篇文章 0 订阅

订阅专栏

tesseract-OCR
第一步：下载后傻瓜式安装即可，路径可自行定义，语言包可自行勾选，但勾选语言包较多时下载较慢，本人建议直接安装，安装后根据需要再去下载语言包。
第二步：配置环境变量
将tesseract-OCR安装的地址配到环境变量path中
在这里插入图片描述
使用方式：
打开终端输入
查看版本信息：tesseract -v
查看现有语言包：tesseract --list-langs

语言包下载地址：OCR语言包下载提取码：tocr

python使用方式
pytesseract安装：pip install pytesseract
PIL安装：pip install pillow

import pytesseract
from PIL import Image
# 然后指定 tesseract 目录，该目录是安装tesseract-OCR的目录：
pytesseract.pytesseract.tesseract_cmd = "D:/tool/Tesseract-OCR/tesseract.exe"
# 然后使用 pillow 库加载图片：
img = Image.open('图片路径')
# 最后使用 tesseract 识别图像的文字，chi_sim中文简体:
text = pytesseract.image_to_string(img, lang='chi_sim')
print(text)
# 查看识别效果 conf=-1时说明未识别出
print(pytesseract.image_to_data(img,lang='chi_sim'))

土豆是大傻子

关注

3
点赞
踩
12

收藏

觉得还不错? 一键收藏
1
评论
tesseract-OCR下载安装及语言库下载

tesseract-OCR第一步：下载后傻瓜式安装即可，路径可自行定义，语言包可自行勾选，但勾选语言包较多时下载较慢，本人建议直接安装，安装后根据需要再去下载语言包。第二步：配置环境变量将tesseract-OCR安装的地址配到环境变量path中使用方式：打开终端输入查看版本信息：tesseract -v查看现有语言包：tesseract --list-langs语言包下载地址：OCR语言包下载提取码：tocr...
复制链接

扫一扫