前言
很多时候我们做 Python 爬虫时或者自动化测试时需要用到 selenium 库,我们经常会卡在登录的时候,登录验证码是最头疼的事情,特别是如今的文字验证码和图形验证码。文字和图形验证码还加了干扰线,本文就来讲讲怎么绕过登录页面。
登录页面的验证,比如以下的图形验证码。

还有我们基本都看过的 12306 的图形验证码。

绕过登录方法
绕过登录基本有两种方法,第一种方法是登录后查看网站的 cookie,请求 url 的时候把 cookie 带上,第二种方法是启动浏览器带上浏览器的全部信息,包括添加的书签和访问网页的 cookie 信息。
第一种 cookie 方法我们要分析别人网站的 cookie 值,找出相应的值然后添加进去,对于我们不熟的网站,他们可能也会做加密或者动态处理,所以有些网站也不是那么好操作。如果是自己公司的网站需要测试,我们可以询问对应的开发那个 cookie 值是区分独立用的值,拿出来放在请求里面就行。
添加 cookie 绕过登录
比如我们登录百度账号比较费

本文介绍了Python爬虫如何绕过登录页面的验证,包括使用cookie、selenium启动Chrome和Firefox浏览器,并提供了如何处理图形验证码的方法。通过分析网站cookie,结合浏览器驱动,可以在自动化过程中保持登录状态,简化爬虫流程。
最低0.47元/天 解锁文章
326

被折叠的 条评论
为什么被折叠?



