这篇文章主要介绍了python3使用Pillow、tesseract-ocr与pytesseract模块的图片识别的方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
1.安装Pillow
pip install Pillow
2.安装tesseract-ocr
github地址: https://github.com/tesseract-ocr/tesseract
或本地下载地址:https://www.jb51.net/softs/538925.html
windows:
The latest installer can be downloaded here: tesseract-ocr-setup-3.05.01.exe and tesseract-ocr-setup-4.00.00dev.exe (experimental).
ubuntu:
sudo apt-get install tesseract-ocr
traineddata文件路径: /usr/share/tesseract-ocr/tessdata/
3.安装pytesseract
pip install pytesseract
如不能使用pip直接安装可取搜索模块文件直接安装
遇到问题及解决:
1.FileNotFoundError: [WinError 2] 系统找不到指定的文件
解决办法:
方法1[推荐]: 将tesseract.exe添加到环境变量PATH中,
例如: D:\Tesseract-OCR,默认路径为C:\Program Files (x86)\Tesseract-OCR
注意: 为了使环境变量生效,需要