1.安装
pip install selenium
2.准备驱动
当前支持诸如chrome,firefox,Edge,IE等主流浏览器,前提是要下载浏览器驱动(驱动下载地址上网自行百度),否则会报诸如以下此类的错误:
selenium.common.exceptions.WebDriverException: Message: 'IEDriverServer.exe' executable needs to be in PATH. Please download from http://selenium-release.storage.googleapis.com/index.html and read up at https://github.com/SeleniumHQ/selenium/wiki/InternetExplorerDriver
selenium.common.exceptions.WebDriverException: Message: 'geckodriver' executable needs to be in PATH.
selenium.common.exceptions.WebDriverException: Message: 'chromedriver' executable needs to be in PATH. Please see https://sites.google.com/a/chromium.org/chromedriver/home
下载浏览器版本匹配的驱动后,放在python目录下的Scripts目录下即可。
3.完成以上步骤后,下面便可以调用使用浏览器了
取个简单的例子:
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
if __name__ == '__main__':
driver = webdriver.Firefox()
driver.set_window_position(x=50,y=60)
driver.set_window_size(width=1366, height=700)
driver.get("http://www.python.org")
print driver.title
driver.close()
简单介绍一下上面例子:
- 首先实例化一个FireFox WebDriver对象。
- 之后,driver.set_window_position方法来设置浏览器窗口的起始位置(就是浏览器左上角的坐标位置)
- driver.set_window_size用来设置浏览器窗口的大小。
- 重点的dirver.get()方法,用来导航到给定的url地址的网页。WebDriver 将会等待直到页面全部加载完成后才会把控制权返回给脚本。
- 最终,浏览器窗口关闭。当然,你也可以调用driver.quit()方法来结束浏览器调用,两个方法的不同之处在于,close()方法是关闭当期的浏览器窗口,而quit()方法是退出整个浏览器。
4.页面交互
要与页面进行交互,首先我们需要定