背景
在对某网站(aHR0cHM6Ly9qenNjLm1vaHVyZC5nb3YuY24vZGF0YS9jb21wYW55L2RldGFpbD9pZD0wMDIxMDUyOTEyMzk0NTEzMDk=)进行逆向爬虫的过程中,发现除了常规的js加密算法外,还存在如下图所示的推理验证码,经过分析采用的是极验的三代空间推理验证码,因此本篇文章针对验证码进行逆向分析。
分析过程
经过分析发现,验证码每次会大概每次爬取40+数据,就会触发验证码机制,如果不进行处理,那么每次都需要手动更新accesstoken,非常麻烦。因此只有逆向极验推理验证码,才能正确爬取数据。
通常有两种主流思路来解决验证码:
-
1、通