为了可以爬取动态网页的内容,配置了Selenium+Firefox的环境。
前提:
Anaconda3
Win10
Firefox 61.0.1
Selenium 3.13
1、下载Firefox驱动
地址:https://github.com/mozilla/geckodriver/releases/
选择合适版本的geckodriver,然后解压得到exe文件,并将geckodriver放到一个指定的位置下(我将它放在了G:\Anaconda3\Scripts下),然后将这个位置配置到Path环境变量中。
2、运行代码测试
from selenium import webdriver
import time
driver = webdriver.Firefox()
driver.maximize_window()
time.sleep(5)
driver.get('https://www.baidu.com')
driver.close()
如果弹出了百度的界面就说明成功了。
3、常见问题
1)、selenium.common.exceptions.WebDriverException: Message: 'geckodriver' executable needs to be in PATH.
出现上面的问题说明了没有将geckodriver配置到Path环境变量中,只需将geckodriver加入到Path中即可。可以通过cmd输入geckodriver,如果出现了信息就说明配置好了。
2)、ConnectionAbortedError: [WinError 10053] 你的主机中的软件中止了一个已建立的连接
先确认是否是版本的问题。
如果版本没有问题的话可以下载v0.20.0 版本的驱动。