Mac安装使用tesseract-ocr

最新推荐文章于 2024-09-24 10:47:26 发布

苑灵格

最新推荐文章于 2024-09-24 10:47:26 发布

阅读量1k

点赞数 1

分类专栏：总结

本文链接：https://blog.csdn.net/yuanlingGeGe/article/details/100764897

版权

本文介绍了如何在Mac上安装Tesseract OCR引擎，包括下载语言库并将其放置在正确目录，以及如何通过终端使用Tesseract进行帮助查看和多语言识别。

摘要由CSDN通过智能技术生成

Tesseract是一个开源的OCR引擎，能识别100多种语言（中，英，韩，日，德，法…等等），但是Tesseract对手写的识别能力较差。

1.安装

//先安装依赖库libpng, jpeg, libtiff, leptonica
brew install leptonica
//安装tesseract
brew install  tesseract
//与python对接需要安装的包
pip3 install Pillow
pip3 install pytesseract

2.下载语言库

下载地址:https://github.com/tesseract-ocr/tessdata
根据自己的需求选择所要的语言库，在这里我们选择的是简体中文所以选择的库是：chi_sim.traineddata、eng.traineddata
在这里插入图片描述
将文件拷贝到到：/usr/local/Cellar/tesseract/3.04.01_2/share/tessdata目录下。