Mac中安装tesseract

最新推荐文章于 2024-04-28 22:58:32 发布

Lynn_mg

最新推荐文章于 2024-04-28 22:58:32 发布

阅读量1.4k

点赞数

分类专栏： Python 文章标签： tesseract 验证码识别 Python

本文链接：https://blog.csdn.net/Lynn_mg/article/details/84836026

版权

Python 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

tesseract简介

OCR(Optical Character Recognition)即光学字符识别技术，专门用于对图片文字进行识别，并获取文本。

tesseract-ocr引擎先由HP实验室研发，后来成为一个开源项目，主要由google进行改进优化。

安装tesseract

brew install tesseract

测试tesseract：

test.jpg:
在这里插入图片描述

tesseract test.jpg output #识别test.jpg的图片，把结果放到output.txt中

python接口

python有着更加优雅的方式调用系统的tesseract工具，首先安装pytesseract模块

 pip3 install pytesseract

pytesseract是对tesseract的封装，要和PIL联合使用，基本用法如下：

import pytesseract
from PIL import Image
img = Image.open('./test.jpg') #先创建image对象
text = pytesseract.image_to_string(img) #直接转化成string，更多参数可以查看文档
print(text)  #"OFXo"

Lynn_mg

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Mac中安装tesseract

tesseract简介OCR(Optical Character Recognition)即光学字符识别技术，专门用于对图片文字进行识别，并获取文本。tesseract-ocr引擎先由HP实验室研发，后来成为一个开源项目，主要由google进行改进优化。安装tesseractbrew install tesseract测试tesseract：test.jpg:tesseract ...
复制链接

扫一扫

专栏目录