QQ群爬虫
简述
通过扫码进行登录QQ, 从而获取该QQ所有的QQ群,可以通过QQ群号码获取群内所有的成员信息(群号码,群成员,群名称,群成员QQ号,性别,Q龄,入群时间,最后发言时间)。提供了QQ群的一些方法(修改群成员昵称,设置管理员,取消管理员,添加群成员,删除群成员,返回一个群所有的群成员信息,返回该QQ的所有的QQ群)。
分析
QQ扫码登录
获取Cookie信息
在下载扫码图片前,我们需要获取网站主页的cookie信息,需要访问https://xui.ptlogin2.qq.com/cgi-bin/xlogin
获取传递过来的cookie信息。其中访问之前需要携带以下参数:
参数 | 值 |
---|---|
pt_disable_pwd | 1 |
appid | 715030901 |
daid | 73 |
hide_close_icon | 1 |
pt_no_auth | 1 |
s_url | https://qun.qq.com/member.html |
完整url地址是:https://xui.ptlogin2.qq.com/cgi-bin/xlogin?pt_disable_pwd=1&appid=715030901&daid=73&hide_close_icon=1&pt_no_auth=1&s_url=https%3A%2F%2Fqun.qq.com%2Fmember.html
访问url地址获取返回的cookie信息,截图cookie信息如下:
获取扫码二维码图片
构建二维码图片url地址,携带cookie向服务器发起get请求,获取响应内容。二维码地址为:https://ssl.ptlogin2.qq.com/ptqrshow? 参数如下:
参数 | 值 |
---|