Selenium 使用指南:从入门到精通
Selenium 是一个用于自动化 Web 浏览器操作的强大工具,广泛应用于自动化测试和 Web 数据爬取中。本文将带你从入门到精通地掌握 Selenium,涵盖其基本操作、常用用法以及一个完整的图片爬取示例。
1. 环境配置
1.1 安装 Selenium
在 Python 环境中,可以通过 pip 安装 Selenium:
pip install selenium
1.2 下载 WebDriver
Selenium 需要与特定浏览器的 WebDriver 一起使用。例如,若使用 Chrome 浏览器,需要下载 ChromeDriver 并确保路径已配置好。
1.3 设置 WebDriver 路径
将下载的 WebDriver 解压后,路径可以设置到系统环境变量中,或在代码中指定其位置。
2. Selenium 基本用法
2.1 启动浏览器并打开页面
from selenium import webdriver
# 创建 Chrome 浏览器实例并指定 WebDriver 路径
driver = webdriver.Chrome(executable_path=r'C:\Program Files\Google\Chrome\Application\chromedriver.exe')
# 打开网页
driver.get('https://www.example.com')
# 关闭浏览器
driver.quit()
2.2 查找元素
可以通过多种方式查找页面中的元素:
# 通过 ID
element_by_id = driver.find_element_by_id('element-id')
# 通过 name
element_by_name = driver.find_element_by_name('element-name')
# 通过 class
element_by_class = driver.find_element_by_class_name('element-class')
# 通过 tag
element_by_tag = driver.find_element_by_tag_name('tag-name')
# 通过 CSS selector
element_by_css = driver.find_element_by_css_selector('css.selector')
# 通过 XPath
element_by_xpath