目录
前言
本文章简单介绍如何用python中的pytesseract工具调用Tesseract库实现文字识别。本篇文章是搜集网络资料再结合本人的观点和思考编撰而成,在此十分感谢作者提供的帮助!
代码前准备
调用模块
首先,win+R在弹出的窗口中输入cmd(如图 1.1)
(图 1.1)
(tips:在此建议大家用“管理员”身份运行cmd)
输入后会弹出一个对话框,在对话框内先后输入以下两行代码
pip install pytesseract
pip install pillow
下载并安装Tesseract
介绍
Tesseract 是一个OCR 库,你可以用pytesseract这个OCR工具来调用它
下载安装
我们可以到这个网站 https://digi.bib.uni-mannheim.de/tesseract/中选择适合你电脑电脑系统以及Tesseract的版本(一般来说数字越大,版本越高)
(图1.2)
选择合适的版本下载下来(图1.2)(注意这个w64和w32)
直接点击这个已经下好的安装包开始安装,点击Next