Tesseract OCR 安装与使用教程

最新推荐文章于 2024-08-08 08:23:51 发布

乔或婵

最新推荐文章于 2024-08-08 08:23:51 发布

阅读量275

点赞数 5

本文链接：https://blog.csdn.net/gitblog_00245/article/details/141015105

版权

Tesseract OCR 安装与使用教程

tesseracttesseract-ocr/tesseract: 是一个开源的光学字符识别（OCR）引擎，适用于从图像中提取和识别文本。特点是可以识别多种语言，具有较高的识别准确率，并且支持命令行和API调用。项目地址:https://gitcode.com/gh_mirrors/te/tesseract

1. 项目目录结构及介绍

在 tesseract 项目的根目录下，你可以找到以下关键文件和目录：

目录结构

.
├── COPYING                    // 许可证文件
├── Dockerfile                 // Docker 镜像构建文件
├── examples                   // 示例代码
├── include                    // 头文件
│   └── api                    // 库接口头文件
├── lib                        // 库文件
├── ltadmin                    // 语言数据管理工具
├── scripts                    // 脚本文件
└── src                        // 源代码目录
    ├── api                    // API 实现
    ├── ccmain                  // 主要程序组件
    ├── classifier              // 分类器模块
    ├── cube                    // Cube OCR 引擎相关
    ├── dict                    // 字典模块
    ├── training                // 训练工具
    └── unicharset               // Unicode 字符集处理

这些目录包含了项目的核心源码、库文件、脚本以及用于构建和训练 OCR 系统的工具。

2. 项目的启动文件介绍

Tesseract OCR 的主要执行文件是 tesseract 命令行工具，通常位于安装路径下的 bin 目录中。在 Linux 或 macOS 中，可以通过终端直接运行 tesseract 来启动该工具。在 Windows 上，可以在命令提示符或 PowerShell 中通过 tesseract.exe 执行。

使用的基本语法是：

tesseract [input_image] [output_base_name] [language_code] [output_type]

例如，识别一张名为 image.png 的图像并保存结果为文本文件：

tesseract image.png output text

这里，text 是输出类型（默认为纯文本）。

3. 项目的配置文件介绍

Tesseract OCR 使用 config 文件来指定特定的参数设置。一个简单的配置文件可能包括以下内容：

-oem 1       # 使用 LSTM 引擎
psm 6        # 视为单个文本行
tessedit_char_whitelist abcdefghijklmnopqrstuvwxyz0123456789

在运行 tesseract 时，可以这样指定配置文件：

tesseract image.png output config_file_name.config

这里的 config_file_name.config 是你的配置文件路径。

此外，还可以使用环境变量来全局地影响 Tesseract的行为，如 TESSDATA_PREFIX 设置数据文件的路径。

请注意，为了完整理解 Tesseract 的所有选项，建议查阅官方文档和示例以获取详细信息。[1]

乔或婵

关注

5
点赞
踩
5

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫