经验总结：用Python爬虫存下自己的QQ空间并进行本地浏览

最新推荐文章于 2024-06-20 13:05:25 发布

涵月楼主

最新推荐文章于 2024-06-20 13:05:25 发布

阅读量579

点赞数

文章标签： python selenium pyqt

本文链接：https://blog.csdn.net/HYLZ2019/article/details/107796107

版权

博主使用Python的Selenium爬取QQ空间，通过PyQt5构建本地浏览器。在爬取过程中遇到iframe、元素加载等问题，通过设置隐式等待和切换iframe解决。之后利用PyInstaller打包发布软件。

摘要由CSDN通过智能技术生成

概览

我的QQ空间里存了我自己很多宝贵的黑历史，因此我希望能把这些个人文字都保存下来以供在本地浏览，以防服务器遭遇不测。在经历了一些挫折后我选择用Python实现这项需求。这个项目主要分成两个部分：第一个是爬虫部分，我主要用Selenium模块实现；第二个是“浏览器”部分，我主要用PyQt5模块实现。
项目代码可见：https://github.com/HYLZ-2019/LocalZone
目前还在施工中，这个帖子持续更新，主要记录我在搬砖过程中遇到的一些困难。本人太菜，还请多多包涵。

0 用Anaconda配置虚拟环境

我的Anaconda是在上个学期下的，不过我前不久才发现了Anaconda的正确用法——真香！创建一个新的虚拟环境，然后在里面install自己这个项目所需的模块，就可以轻松解决“各种各样模块版本不兼容带来的乱七八糟问题”，非常方便。

0.0 但是要记得activate虚拟环境

我自己的设置是每次重启电脑后都要重新activate才能进入虚拟环境。所以我经常F5出模块缺失才发现自己忘开了。

1 用Selenium爬取QQ空间

我的爬虫雏形主要参考了这篇博客：
https://www.cnblogs.com/lulu-beibei/p/6026468.html
语言颇具风格，但很适合本菜看懂（x
在这个博主的推荐下，我采用了Selenium模块，发现它真的非常直观——就是直接模拟人类操作。我在内部用的是ChromeDriver，为了运行这个，还得给自己的Chrome浏览器

最低0.47元/天解锁文章

涵月楼主

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
经验总结：用Python爬虫存下自己的QQ空间并进行本地浏览

概览我的QQ空间里存了我自己很多宝贵的黑历史，因此我希望能把这些个人文字都保存下来以供在本地浏览，以防服务器遭遇不测。在经历了一些挫折后我选择用Python实现这项需求。这个项目主要分成两个部分：第一个是爬虫部分，我主要用Selenium模块实现；第二个是“浏览器”部分，我主要用PyQt5模块实现。项目代码可见：https://github.com/HYLZ-2019/LocalZone目前还在施工中，这个帖子持续更新，主要记录我在搬砖过程中遇到的一些困难。本人太菜，还请多多包涵。0 用Anacon
复制链接

扫一扫