Tesseract-OCR Windows 64-bit 5.5.0 安装与使用指南

最新推荐文章于 2025-04-11 15:24:35 发布

gs80140

最新推荐文章于 2025-04-11 15:24:35 发布

阅读量5.2k

点赞数 33

分类专栏：基础知识科谱文章标签： ocr tesseract

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gs80140/article/details/145138997

版权

基础知识科谱专栏收录该内容

110 篇文章

订阅专栏

目录

一、准备工作

二、安装步骤

三、配置环境变量

四、验证安装

五、示例使用

1. 基本命令

2. 多语言识别

3. 自定义输出格式

六、常见问题及解决方案

1. 找不到 tesseract 命令

2. 中文识别不准确

3. 输出乱码

七、卸载方法

Tesseract-OCR Windows 64-bit 5.5.0 安装与使用指南

前言

Tesseract-OCR 是一款开源的光学字符识别 (OCR) 引擎，支持多种语言识别，广泛用于文档扫描、图像文字提取等任务。本文将详细介绍如何在 Windows 平台上安装 Tesseract-OCR 5.5.0 版本，并进行基础配置与示例使用。

一、准备工作

操作系统要求：Windows 7/8/10/11 64-bit
下载地址：访问 Tesseract-OCR 官方发布页下载 tesseract-ocr-w64-setup-5.5.0.20241111.exe 安装包。
实际下载网址: https://github.com/UB-Mannheim/tesseract/wiki

二、安装步骤

运行安装程序
- 双击 tesseract-ocr-w64-setup-5.5.0.20241111.exe 文件，启动安装向导。
选择语言包
- 安装向导提供了多个语言包供选择。
- 默认情况下包含 English (eng) 语言包，您可以勾选 Chinese Simplified (chi_sim) 和其他所需语言包。
选择安装目录
- 默认安装路径为 C:\Program Files\Tesseract-OCR。
- 可以根据需要更改安装位置，但建议避免安装到系统保护的路径。
完成安装
- 点击 Install 按钮，等待安装过程完成。
- 完成后，点击 Finish 退出安装程序。

三、配置环境变量

为了在命令行中直接使用 tesseract 命令，需要配置环境变量：

打开系统环境变量配置窗口
- 右键点击 此电脑 -> 属性 -> 高级系统设置 -> 环境变量。
添加路径
- 在 系统变量 中找到 Path，点击 编辑。
- 新增 C:\Program Files\Tesseract-OCR，然后点击 确定 保存。

四、验证安装

打开 cmd 命令提示符。
输入以下命令检查 Tesseract 版本：
```
tesseract --version
```
如果返回版本信息，如 tesseract v5.5.0，说明安装成功。

五、示例使用

1. 基本命令

tesseract input.png output.txt

input.png 为输入的图片文件。
output.txt 为输出的文本文件。

2. 多语言识别

tesseract input.png output.txt -l chi_sim+eng

-l 参数用于指定语言，多个语言可用 + 连接。

3. 自定义输出格式

输出为 PDF 文件：
```
tesseract input.png output pdf
```
输出为 TSV 文件：
```
tesseract input.png output tsv
```

六、常见问题及解决方案

1. 找不到 `tesseract` 命令

检查环境变量配置是否正确。
重启命令提示符窗口再试。

2. 中文识别不准确

确保安装了 chi_sim 语言包。
图片清晰度不足会影响识别效果，建议提高分辨率或进行预处理。

3. 输出乱码

可以尝试将图片转换为灰度图或二值化后再识别。

七、卸载方法

如果需要卸载 Tesseract-OCR：

打开 控制面板 -> 程序和功能。
找到 Tesseract OCR，右键点击，选择 卸载。
删除 C:\Program Files\Tesseract-OCR 文件夹（如果需要）。

八、总结

通过上述步骤，您可以成功在 Windows 平台上安装并使用 Tesseract-OCR 5.5.0。Tesseract 作为一款功能强大的 OCR 工具，适用于多种文字识别场景。在使用过程中可以结合图像预处理工具提升识别效果，实现高效的文本提取。

博客等级

码龄17年

423
原创

5170
点赞

3747
收藏

1万+
粉丝

关注

私信

热门文章

分类专栏

k8s专栏 19篇
基础知识科谱 110篇
openEuler 8篇
12306 1篇
AI 157篇
mcp 13篇
hadoop 4篇
DataSphereStudio 3篇
Aleo编程专栏 1篇
各种问题 125篇
apacheds 1篇
openldap 1篇
我是有兴趣爱好的 8篇
code 8篇
源码分析 1篇

展开全部收起

最新评论

Celery 入门指南：Python 的强大任务队列框架
北风之神c: 总结的很全面，写得赞，博主用心了。 celery对目录层级文件名称格式要求太高，只适合规划新的项目，对不规则文件夹套用难度高。所以新手使用celery很仔细的建立文件夹名字、文件夹层级、python文件名字。在不规范的文件夹路径下，使用celery难度很高，一般教程都没教。 [项目文件夹目录格式不规范下的celery使用演示](https://github.com/ydf0509/celery_demo) 。此国产分布式函数调度框架 funboost python万能通用函数加速器 https://funboost.readthedocs.io/zh-cn/latest/articles/c1.html ，从用法调用难度，用户所需代码量，超高并发性能，qps控频精确程度，支持的中间件类型，任务控制方式，稳定程度等20个方面全方位超过celery。发布性能提高1000%，消费性能提高2000%。 python万能分布式函数调度框架funboost支持python所有类型的并发模式和一切知名消息队列中间件，python函数加速器，只需要一行代码调度任意函数，框架包罗万象,万能编程功能宝典，一统编程思维，与业务不绑定，适用范围广。通过 funboost web manager 全方位可视化管理和查看你的函数运行情况，无需看文件日志。 https://funboost.readthedocs.io/zh-cn/latest/articles/c13.html pip install funboost
用 LangChain + GPT 构建自动合成数据 Agent：模块拆解与实现思路全解析
云溪龙: 这个类似于简单的数据增强
Tesseract-OCR Windows 64-bit 5.5.0 安装与使用指南
gs80140: 看不了他的结构，它的效果也一般，不如用paddle ocr,mm ocr
Tesseract-OCR Windows 64-bit 5.5.0 安装与使用指南
duhejd: 请教下博主，怎么查看tesseract的网络结构呢？
Docker Compose 安装了 Milvus 单机版启用安全验证
AI浮生若水: docker compose里的milvus-standalone 启动报错 [2025/03/06 16:18:24.075 +00:00] [WARN] [grpcclient/client.go:262] ["failed to get client address"] [error="find no available datacoord, check datacoord state"] [2025/03/06 16:18:24.075 +00:00] [WARN] [grpcclient/client.go:480] ["fail to get grpc client in the retry state"] [client_role=datacoord] [error="find no available datacoord, check datacoord state"] [2025/03/06 16:18:24.079 +00:00] [WARN] [grpcclient/client.go:494] ["grpc client is nil, maybe fail to get client in the retry state"] [client_role=querycoord] [error="empty grpc client: find no available querycoord, check querycoord state"] [errorVerbose="empty grpc client: find no available querycoord, check querycoord state\n(1) attached stack trace\n -- stack trace:\n | github.com/milvus-io/milvus/internal/util/grpcclient.(*ClientBase[...]).call.func2\n | \t/workspace/source/internal/util/grpcclient/client.go:493\n | github.com/milvus-io/milvus/pkg/v2/util/retry.Handle\n | \t/workspace

大家在看

最新文章

2025

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。