一 安装相关库
1. 安装Pillow与PIL,对于python3.x用户请安装Pillow,对于python2.x用户请安装PIL,因为python3.x不在支持PIL,
安装请参考:http://blog.csdn.net/dcz1994/article/details/71642979
2.图像识别库安装,这里我们安装Tesseract-OCR:http://blog.csdn.net/yxw1998/article/details/79053279
3.安装pytesseract,利用pip install pytesseract来实现安装
4.安装好pytesseract和Tesseract-OCR,有一个地方需要修改,就是我们要在pytesseract.py文件中告诉它Tesseract-OCR的路径,修改办 法如下:
a.找到pytesseract.py文件,位于pytesseract库的安装路径下,我的在C:\Users\zhangji\AppData\Local\Programs\Python\Python36-32\Lib\site-packages\pytesseract;
b. 打开这个文件,里面清楚的告诉了我们,需要将tesseract_cmd这个参数设置为我们本地安装的Tesseract-OCR的绝对路径,如下所示
二 开始图像处理
1. 在开始图像处理之前,请大家先熟悉pillow这个库的基本功能,这里感谢廖雪峰的文章:
https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/0014320027235877860c87af5544f25a8deeb55141d60c5000