内容介绍: pytesseract安装教程、 pytesseract入门、文字识别、图片识别、pytesseract报错解决、中文识别
1.使用豆瓣源进行安装下列库
pip install pytesseract -i https://pypi.douban.com/simple
pip install pillow==8.4.0 -i https://pypi.douban.com/simple
2.下载pytesseract驱动,只限 windows
tesseract-ocr-w64-setup-v5.1.0.20220510.exe
直接进行安装就行了,就是下一步下一步,路径不要有中文! 要记住安装在哪里! 下图是我安装的地方
下方免费提供软件下载地址
3.进行环境配置
找到桌面图标【我的电脑】,右键点击属性
找到高级系统设置
点击环境变量
新建用户变量,创建变量名,填入你的安装地址
4.修改文件
导入包,然后调用 _ _ path _ _ ,打印当前库所在的路径,复制并打开(路径中每个双斜杠要删除掉一个反斜杠,不然打不开)
打开编辑 pytesseract.py
找到 tesseract_cmd = 修改路径地址为当前驱动地址
4.测试
测试识别验证码
到这里就完成了!
5.识别中文
需要下载 chi_sim.traineddata、chi_sim_vert.traineddata、chi_tra.traineddata和chi_tra_vert.traineddata文件,将它们复制到下面的文件夹中 D:\Tesseract-OCR\tessdata
下方免费提供软件下载地址
6.下载地址
请及时保存到网盘,如果失效可及时私信我领取,或者关注微信公众号:【先知商贾】联系作者索取
公开永久免费链接: 永久免费下载
或者复制 下方的识别码,打开夸克浏览器即可 识别:
/~7e8d3128wo~:/