python 用selenium获取好友空间说说及时间写入txt

我们的目标是抓取qq空间里好友的说说及发表说说的时间,在开始之前先做好预备工作。


首先是先装个自动化测试工具selenium,它支持各种浏览器,在python里直接pip就可以安装了(ps:selenium主要用于动态网页,查找速度慢,解析时要注意):

pip install selenium

然后我们用selenium里面的一个webdriver工具,使用这个工具要下载对应浏览器的驱动,这里用我用的是chrome,另外驱动版本对应的浏览器版本的如下(每个notes文本里都有对应的版本):

http://npm.taobao.org/mirrors/chromedriver/

把下载好的压缩文件里的文件解压到chrome的文件夹,我们在开始之前再装个requests模块,这是爬虫必须装的模块同样,直接pip:

pip install requests

在开始写基本代码前我们先来看看现在的qq空间的网页布局。


可以看到,如果电脑登陆了qq,那么可以直接点击头像来进入qq空间,那么我们第一步就来实现进入自己的qq空间。

首先使用浏览器的f12调试工具查看这个头像框在html代码里的位置,然后获取找到它的xpath,这个比较容易看出id为img_out_ + qq号 。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值