Python+selenium+firefox模拟登录微博并爬取数据(1

本文介绍了使用Python3.5、Selenium 3.14.0和Firefox进行网页模拟登录及数据爬取的初步配置。重点强调Selenium库与浏览器版本匹配的重要性,以及GeckoDriver的下载和环境变量设置。文中还提到安装Firefox时关闭自动升级选项,以确保稳定运行。最后展示了等待页面加载的示例代码,并预告下节将进行模拟登陆和页面跳转。
摘要由CSDN通过智能技术生成

1:环境python3.5,最新 firefox,selenium-3.14.0.

本来准备用无界面的,但是感觉效果不好看出来所以先用有界面的浏览器来做。分几次来慢慢写。这节先配置好环境。

2:安装:

Python Selenium库的版本要对应浏览器的版本,不然可能会出现打不开浏览器,或者打开浏览器,打不开页面的情况。这个非常重要。

开始时:

我直接 pip install -i https://pypi.douba.com/simple selenium 。下载的版本不对。(太低了。)

最新版的应该是如下图的:

Python+selenium+firefox模拟登录微博并爬取数据(1)

切记一定要安装最新的这个版本 :

Pip install selenium==3.14.0。

接下来 就是下载驱动了:

Github上面下载,地址为:

https://github.com/mozilla/geckodriver/releases

Python+selenium+firefox模拟登录微博并爬取数据(1)

最新的是这个。他要求的selenium版本要在3.11 之上。所以这里得尊重一下。开始我没注意到python 安装的s

评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值