这两下载完了,接下来就是:
pip install Pillow
pip install pytesseract
下载工具对应所需要的包啦。下载完后试试如下两个命令:
接下来我们可以开始写代码了:
–>>>清安<<<—
from PIL import Image
import pytesseract
打开图片
image = Image.open(r’PIC/3.jpg’)
灰度处理
image1 = image.convert(‘L’)
识别图片,lang是对应的字体
text = pytesseract.image_to_string(image,lang=‘eng’)
打印识别内容
print(text)
好了,这里是个简单的例子。验证码可以自己百度上找。打开图片这里的路径根据自己的实际情况更改。lang='eng’这里,也可以不要,这里的意思就是识别中文还是英文,如果是中文那么需要另外下来语言包。默认英文。
这里,有很多朋友跑起来之后会报错,提示你什么什么path没有发现或者不对的。改一下配置就好。上述代码中按住ctrl鼠标点击image_to_string方法,会进入到pytesseract.py文件。
将此处注释的改成你的Tesseract-OCR文件内的tesseract.exe路径即可,然后重启电脑。
注意:这样的方法可以识别验证码码,但是准确率太低了,甚至有很多不能识别。所以介绍到此结束。
ddddorc
=======
这个包就比上一个方法强很多了。识别率也是比较不错的。但是呢,作者比较的流氓。大佬很强但是也很流氓。至于为什么这么说,各位去试试就知道了。pip install ddddorc
好了玩笑到这里。大家不喜欢作者的库每次打开后都有一些介绍信息的可以去源代码删了,下面会介绍。
from ddddocr import DdddOcr
实例化方法
ocr = DdddOcr()
打开图片
file = open(r’./PIC/7.png’,‘rb’)
读取图片
img = file.read()
识别图片
result = ocr.classification(img)
打印内容
print(result)
上述例子,验证码自己备好哦。上述简单的例子就能完成验证码图片识别了。可以自己去试试。
DdddOcr是里面的一个类方法。里面还有一些其他的功能各位大佬自己去试试吧。本文只介绍图片识别哦。上面比较的好理解吧。那么我们进入实战。
“”"
体验管理员: admin
密码: shopxo
https://d2.shopxo.vip/admin.php?s=admin/logininfo.html
“”"
是一个后台管理的地址,请不要乱删改里面的内容,作者开源不易。
我们先用最简单的脚本来写一下:
–>>>清安<<<—
from PIL import Image
from ddddocr import DdddOcr
from selenium import webdriver
from time import sleep
“”"
体验管理员: admin
密码: shopxo
https://d2.shopxo.vip/admin.php?s=admin/logininfo.html
“”"
现在能在网上找到很多很多的学习资源,有免费的也有收费的,当我拿到1套比较全的学习资源之前,我并没着急去看第1节,我而是去审视这套资源是否值得学习,有时候也会去问一些学长的意见,如果可以之后,我会对这套学习资源做1个学习计划,我的学习计划主要包括规划图和学习进度表。
分享给大家这份我薅到的免费视频资料,质量还不错,大家可以跟着学习
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!