作为贴吧重度用户,写了个贴吧爬虫脚本
抄了一些别人的代码,记得有个验证码解决的,但是忘了链接了,今天终于自己解决了。
首先要让登陆需要验证码,不停地登陆就好了。。。度娘很快会加上验证码大法的。。。需要验证码的情况下,直接登陆返回的错误信息是error=257
打开贴吧首页选择登陆,弹出验证码,找到验证码的链接是
右键在新标签页中打开
注意到链接是
https://passport.baidu.com/cgi-bin/genimage?jxIcaptchaservice+一串字母数字
这个时候根据之前写的代码,判定登陆成功是根据post登录数据之后返回的一串链接,链接格式是这样: