Tesseract模型识别提取图像文字

一、OCR

OCR,即Optical Character Recognition,光学字符识别,是指通过扫描字符,然后通过其形状将其翻译成电子文本的过程。

二、Tesseract

目前最流行的开源OCR软件就是*Tesseract*。

Tesseract是一款由HP实验室开发由Google维护的开源OCR(Optical Character Recognition , 光学字符识别)引擎,与Microsoft Office Document Imaging(MODI)相比,我们可以不断的训练的库,使图像转换文本的能力不断增强;如果团队深度需要,还可以以它为模板,开发出符合自身需求的OCR引擎。

Tesseract-ocr Github 地址如下:

https://github.com/tesseract-ocr/tesseract

在这里插入图片描述

三、Windows编译安装Tesseract

1、准备工作

科学上网,否则一些文件下载不了(要从github下载依赖文件)。

2、安装vcpkg

**vcpkg**是Microsoft的跨平台开源软件包管理器,极大地简化了 WindowsLinux macOS 上第三方库的购置与安装。如果项目要使用第三方库,建议通过 vcpkg 来安装它们。vcpkg 同时支持开源和专有库。

① 获取vcpkg源码

Vcpkg的官方源码站点为:microsoft/vcpkg: C++ Library Manager for Windows, Linux, and MacOS (github.com)

git clone https://github.com/microsoft/vcpkg
② 编译vcpkg源码

Windows平台:在cmd中执行Vcpkg工程目录下的“bootstrap-vcpkg.bat”命令,编译好后会在同级目录下生成vcpkg.exe文件。

Linux平台:在命令行中执行在vcpkg工程目录下“sudo bash ./ bootstrap-vcpkg.sh”命令,会生成一个可执行文件vcpkg。定义环境变量 VCPKG_ROOT="/vcpkg"

③ 添加到path环境变量

vcpkg.exe 路径添加到系统path环境变量中,将该源码目录添加至windows的系统用户的path环境变量中。

④ 安装示例

Windows 安装示例如下:
在这里插入图片描述

3、编译安装Tesseract库

① 下载Tesseract源码

github 获取 tesseract 源码:

git clone https://github.com/tesseract-ocr/tesseract

在这里插入图片描述

② 编译Tesseract源码

命令行切换至 tesseract 源码目录下,执行如下命令:

  • 编译生成静态库api命令
vcpkg install tesseract:x64-windows-static
  • 编译生成动态库api命令
vcpkg install tesseract:x64-windows

然后等它全部下载、配置、编译完成即可。完成后,命令行类似这样:

在这里插入图片描述

  • 执行过程:
Microsoft Windows [版本 10.0.20348.169]
(c) Microsoft Corporation。保留所有权利。

C:\Users\Administrator
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值