Selenium 是一个用于自动化 Web 浏览器的工具,适用于爬取动态网页。下面是一个使用 Python 和 Selenium 爬取动态网页的示例。假设我们要爬取一个加载动态内容的网页,并提取其中的一些数据。
环境准备
首先,确保你已经安装了以下工具:
Python:确保安装了 Python 3.x。
Selenium:使用以下命令安装 Selenium。
pip install selenium
浏览器驱动:Selenium 需要浏览器驱动来与浏览器进行交互。以 Chrome 为例,你需要下载 ChromeDriver 并将其添加到系统路径中。
示例代码
下面是一个使用 Selenium 爬取动态网页的示例代码:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
# 配置 WebDriver(这里以 <