Python爬虫，手把手教你爬取QQ空间信息

最新推荐文章于 2023-08-05 22:33:06 发布

VIP文章热到的七月

最新推荐文章于 2023-08-05 22:33:06 发布

阅读量6.4k

点赞数 1

文章标签： python 算法爬虫后端架构

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_60349973/article/details/119413072

版权

前言：

现在流行着一句话，遇事不要慌，朋友圈走一波。不知道还有多少人记得QQ空间，这可是QQ那个年代的青春啊，哎呀，不小心暴露了年龄。好了，废话不多说了，今天来教各位如何爬取QQ空间的信息。

环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块，并前往：

http://npm.taobao.org/mirrors/chromedriver/

下载与自己使用的Chrome浏览器版本对应的驱动文件，下载完毕后将chromedriver.exe所在文件夹添加到环境变量中即可。

原理简介

抓取点QQ空间的数据。

其主要思路为：

利用selenium模拟登录QQ空间从而获取登录QQ空间所需的cookie值，这样就可以利用requests模块来抓取QQ空间的数据了。

一些细节：

（1）第一次获取cookie之后将其保存下来，下次再登录之前先试试保存的cookie有没有用，有用直接使用就可以了，这样可以进一步节省时间。

（2）抓包分析过程中，可以发现抓取QQ空间数据所需请求的链接都包含g_tk这个参数，这个参数实际上是使用cookie中的skey参数计算获得的：

最后：

抓取点数据看看吧

好吧，那就把：

最低0.47元/天解锁文章

热到的七月

关注

1
点赞
踩
24

收藏

觉得还不错? 一键收藏
3
评论
Python爬虫，手把手教你爬取QQ空间信息

前言：现在流行着一句话，遇事不要慌，朋友圈走一波。不知道还有多少人记得QQ空间，这可是QQ那个年代的青春啊，哎呀，不小心暴露了年龄。好了，废话不多说了，今天来教各位如何爬取QQ空间的信息。...
复制链接

扫一扫

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。