抓取qq邮箱联系人

今天是:2010-03-14 ,纪念昨晚熬到3点!

题外话:模拟登陆请求页面这次我用了httpclient4.0,也顺便学习一下,4.0跟以前的版本用法上有很大的不同,具体情况Google一下就知道了,个人觉得知道原理就行了,至于开发包只要能实现目的用那个版本自己决定,这里不多说。

 

言归正传:

Step1、抓取登陆页:http://mail.qq.com/cgi-bin/loginpage 

目的:获取表单提交的action和用于加密密码的ts值

注意:这里获取到得action有两个用途

           1、当然是提交表单

           2、抽出domain用于组装验证码请求url,因为验证码分布在多台机器,某台机器只能验证这台机器的验证码(所以一些旧的文章关于验证码获取的url不能用了)

补充:主页还有个rsa的公钥PublicKey,我直接拷贝出来使用,其他则用正则拿。

Step2、请求验证码:"http://"+domain+"/cgi-bin/getverifyimage?aid=23000101&"+Math.random()

注意:返回的验证码附上了cookie:authimgs_id和verifyimagesession(以前好像叫verifysession),所以拿验证码的时候必须把它们(不要漏了authimgs_id保存下来,因为登陆请求的

           时候 要用到。

Setp3、填充表单:

sid=0,2,zh_CN (默认值)

firstlogin=false   (默认值)

starttime= (请求时间:js中: (new Date()).valueOf() ; java中:Long.toString(System.currentTimeMillis()))

redirecturl= (默认为空)

f=html (默认值)

p= (加密后的秘密:如果是jdk6.0可以调用存放rsa加密函数的js文件(好像是这个safeauth9206l.js,我是jdk5.0环境,所以未试过这种方法)来加密)

delegate_url= (默认为空)

s= (默认为空)

ts= (上面抓取首页的时候已获取)

from= (默认为空)

ppp = (默认为空)

chg = 1 (不用理,就填1好了)

checkisWebLogin = (当前日期所在一周中的第几天再乘3,例如:今天是星期日就是0*3=0,昨天是6*3=18)

uin= (qq号)

pp= (将原始密码的每一个字符替换为0,即密码长度个0组成的字符串)

verifycode=验证码(setp2已拿到)

aliastype=@qq.com (其他未试过)

表单填好了,就可以进入下一步,在这里推荐一个软件:charles,用这个东西可以看到页面http请求的细节,用来分析request and response非常方便

Setp4、登陆

提交表单前记得将setp2拿到的cookie放到请求header里,至于header还需不需要设其他值,个人水平有限,I don't know ~~!,我的做法反正在charles上看到的都弄上去应该没错

提交失败将返回错误页(errtype=1:密码错误、2:验证码错误、17:登陆太多次),否则返回一个跳转页,将跳转页上的urlHeader, sid , r三个 值拿下来重新组装进入首页的url

例如:http://m87.mail.qq.com/cgi-bin/frame_html?sid=0tMsQPhQJlbKWUsA&r=0f5b1e1f4898062431d5c1d21cbd244d

记得保存urlHeader (含有主页用到的域名信息)和 sid 获取联系人的时候要用到

Setp5、获取联系人

组装获取联系人分组列表页面的url :urlHeader+"addr_listall?sid="+_sid+"&sorttype=null&category=common"

例如:http://m87.mail.qq.com/cgi-bin/addr_listall?sid=0tMsQPhQJlbKWUsA&sorttype=null&category=common

进入了分组页,也就得到了进入每一组的url,进去拿就是了!

 

#补充一下个人的一些理解:上面整个过程必须保证始终使用同一个httpclient对象,httpclient隐性地为我们完成了session维持的工作!

(有理解错的,请大侠们指出以便修正,俺水平低下但好学~~)

#这里不提供源码,因为qq邮箱稍有改动,程序就可能用不了,关键是思路!以不变应万变~~

参考资料:

http://www.cnblogs.com/huangcheng/archive/2009/09/14/1566198.html

http://blog.csdn.net/gtuu0123/archive/2009/11/14/4809431.aspx

          

@QQ邮箱改用https协议了,而且邮箱联系人那个页面该版了,不过稍作改动,程序仍然可用 (2010-06-26)

           

转载于:https://www.cnblogs.com/nicholas_f/archive/2010/03/14/1685647.html

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值