爬虫项目十六:用 Python 三十行代码采集QQ群成员信息,很简单


前言

用Python爬取QQ群成员信息数据


提示:以下是本篇文章正文内容,下面案例可供参考

一、抓包

我们进入qun.qq.com登录自己的账号、选择一个群进入,打开抓包工具,向下滑动页面,可以抓到一个数据包 其中包含了20个成员的信息,有网名、QQ、发言时间等等

在这里插入图片描述
现在我们来观察他的url和所带参数 ,找到他的规律,我们可以看到参数中st和end应该就是表示的页数, 意思应该是从第21个到41个,至于gc、bkn应该表示的账号和群组,我们刷新页面抓取第一页的数据包 观察发现 gc、bkn、sort参数都没变,唯独st和end变了,可见st和end就是表示页数的关键

https://qun.qq.com/cgi-bin/qun_mgr/search_group_members
参数:
gc: 自己抓包获取
st: 0
end: 20
sort: 0
bkn: 自己抓包获取

参数:
gc: 自己抓包获取
st: 21
end: 41
sort: 0
bkn: 自己抓包获取

二、代码

我们已经知道了数据页数变化的规律,现在我们来实现其代码的操作

首先写一个函数用于生成Params并传入列表中

def Params_list(self):
    Params_list=[]
    for i in range(96):
        st=i*20+i
        end=st+20
        params={
            "gc": 自己抓包获取,
            "st": st,
            "end": end,
            "sort": 0,
            "bkn": 自己抓包获取
        }
        Params_list.append(params)
    return Params_list

在写一个函数用于访问页面获取数据

def Get_Data(self,params):
    try:
        url="https://qun.qq.com/cgi-bin/qun_mgr/search_group_members"
        head={
            'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.114 Safari/537.36',
            'cookie':'tvfe_boss_uuid=3eec8ab61924dc8d; pgv_pvid=5532717881; RK=CnIgT93OeT; ptcz=1a3ce7dF; traceid=5a73ddf726'
        }
        data=requests.get(url=url,headers=head,params=params).json()
        for da in data["mems"]:
            with open(".//QQ_Group.csv", "a+", encoding="utf-8") as f:
                writer = csv.DictWriter(f, da.keys())
                writer.writerow(da)
    except Exception as e:
        print(e)
        pass

最后有了params列表便可以传入Get_Data函数中获取数据

如果你对爬虫感兴趣,可看我主页已经更新多个爬虫项目、所有爬虫项目代码均在公众号“阿虚学Python”中,本次源码回复“QQ群”获取

在这里插入图片描述
谢谢大家的观看

转载请标明出处

  • 0
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值