微博模拟登陆之验证码的解决方法

近两周有很多在qq群中有很多群友讨论关于微博类爬虫时出现验证码时的解决方法,解决思路很明显,一是人工打码,二是OCR智能识别来解决,前者较简单,后者较难只有大公司才能搞定80%,所以我们一般暂采取人工打码的方式。

   但人工打码,并这里我强调的稍智些的人工打码,而去看浏览器去监测然后再在浏览器中去打码的过程,该实现过程太过啰嗦。本文介绍共享的验证验解决方法,是自动发现验证码,并把验证码通过JAVA的GUI程序将验证码弹出让人输出即可,也可以多次输入,直接输入正确为止,大概的验证码打码样式,如下图:

输入相应的值后提交,系统会自动将验证码和用户名、密码等参数,一起post到微博平台的登陆接口中,从而得到最终正确的cookies,从而进行下一步的数据抓取。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值