随着爬虫技术的日益发展,反爬虫技术也越来越强大,极验(GeeTest)是一家致力于为企业用户提供验证安全的解决方案的公司,通过自主研发的行为安全模型算法,能有效阻止恶意程序对网站的攻击(垃圾注册、撞库登录、薅羊毛等),为网站构建一套全面的安全体系。
极验网址:https://www.geetest.com/,
目前极验主要有滑块,点选2种
验证码对于初级爬虫工程师来说,确实是一个难题,目前市面上也有很多破解的教程,
下面我给大家分享一个可以快速破解的极验版本。别激动,往下看。
目标网站:http://218.77.183.36:1888/index.jspx(国家企业信用信息公示系统)
先抓包看下,常规的先找gt,challenge
再找提交极验服务器的请求
再找请求目标网站的请求
不难看出,最终请求数据,需要携带一个checkNo的参数,不多废话了,直接开说,凡是遇到的极验版本,参数是类似checkNo这种,带下划线的,都可以直接绕过,直接上代码。