python 数字字符识别验证码
啊!之前有人写爬虫的时候问过我,当时我简单说了一下,但是没有具体说,今天稍微说一下,不是什么大问题。在写爬虫的时候有时候会遇到需要登录的情况,需要登录的时候只需要用户名密码还好,很多网站除了用户名密码还会要验证码,就是四位验证码五位验证码之类的东西,很多人遇到验证码的时候就不知道怎么处理了,其实很简单,有一个图像识别的库,叫“带带弟弟”,这个库经过了很多的图像识别学习,很厉害,一般的验证码都能识别出来。如果有条件的话,也可以自己去找模型自己训练,当然如果只是简单的验证码根本不需要,直接拿来用就可以了。
带带弟弟
这个库的名字感觉是个小菜鸡库,但是确实伪装成菜鸡的大佬!但是使用起来很简单。
这个库的全称是 “ddddocr”
然后安装一下,这个库比较大,所以说安装的时候要保证网络畅通!
pip install ddddocr
记住一点,这个库,只支持 3.9 版本及其以下的 python。如果是 3.10 版本的可能需要降级。
安装时间有点长,成功安装之后就可以直接使用了。
下面写一个小案例哈!
比如说我现在有一个验证码的图片1.png,然后我用这个库来识别一下。
执行代码之后直接数据结果,超级快。
再来几个!
发现识别准确率还是挺高的。
好了,就这样吧先。还有其他的玩法,可以直接看他的文档。