识别验证码
在爬取网站的时候有时会遇到有网站验证码的情况,如果你有钱,可以去找一些打码平台,接码平台,方便易操作,但是像我这样的穷学生就只能自己想想办法了,现在还是只能识别一些简单的的验证码
ps:这篇文章不知道已经被别人抄了多少遍了,连原文的地址都不粘贴,好气啊,今天我想了想还是在头条发出来吧。
在python爬虫爬取某些网站的验证码的时候可能会遇到验证码识别的问题,现在的验证码大多分为四类:
-
计算验证码
-
滑块验证码
-
识图验证码
-
语音验证码
这篇博客主要写的就是识图验证码,识别的是简单的验证码,要想让识别率更高,识别的更加准确就需要花很多的精力去训练自己的字体库。小可爱,加下我微信:mengy7762
领取以下福利
1、python安装包
2、程序员电子书籍:5本-10本
3、python项目源码三份:(python破解WiFi密码、VIP视频权限破解、爬虫自动化)
4、基础学习PPT教案
5、免费课程(开课时间15:00、19:30、20:30)自由选择
6、程序员职业规划分享
7、空余时间接单赚钱方法
识别验证码通常是这几个步骤:
-
灰度化吃力
-
二值化
-
去除边框(如果有的话