Selenium自动化测试完全指南：让浏览器乖乖听话的神器

最新推荐文章于 2025-10-06 14:11:20 发布

原创最新推荐文章于 2025-10-06 14:11:20 发布 · 1.3k 阅读

11 ·

CC 4.0 BY-SA版权

文章标签：

#selenium #测试工具 #其他

文章目录

写在前面

你有没有这样的经历？每天重复着点击同样的按钮，填写相同的表单，检查网页上的各种元素…手都点麻了！！！这时候就该Selenium出场了。作为Web自动化测试的王者，它能让浏览器像个听话的小助手一样，帮你完成各种重复性工作。

今天咱们就来聊聊这个让无数程序员又爱又恨的工具。

Selenium到底是什么鬼？

简单说，Selenium就是一套自动化测试工具。想象一下，你有个看不见的小机器人，能够模拟人类操作浏览器——点击、输入、滚动、等待…几乎所有你能在浏览器里做的事，它都能做。

最关键的是，这家伙还免费！！！（这年头免费的好东西真不多了）

Selenium主要包含这几个部分：

Selenium WebDriver - 核心组件，负责控制浏览器
Selenium Grid - 分布式测试，可以同时在多台机器上跑测试
Selenium IDE - 浏览器插件，可以录制测试脚本

为什么要用Selenium？

说实话，刚开始接触自动化测试的时候，我也觉得麻烦。写代码的时间比手工测试还长，这不是吃饱了撑的吗？

但是！（重点来了）

当你的项目越来越复杂，测试用例越来越多的时候，手工测试就变成了噩梦。每次发版前都要点击几百个测试点，光想想就头疼。

而Selenium能帮你：

提高测试效率（跑一遍脚本喝杯咖啡就完事）
减少人为错误（机器不会因为累了就点错按钮）
支持回归测试（改了代码后自动跑一遍，确保没搞坏其他功能）
跨浏览器测试（Chrome、Firefox、Safari一个都不放过）

环境搭建：第一步总是最痛苦的

好了，废话不多说，直接上手！先来搭建环境。

安装Python和pip

如果你用的是Mac或Linux，Python通常已经预装了。Windows用户建议去Python官网下载最新版。

检查一下版本：

python --version
pip --version

安装Selenium

这步超简单，一行命令搞定：

pip install selenium

下载浏览器驱动

这里有个坑！！！ Selenium需要对应的浏览器驱动才能工作。以Chrome为例：

查看你的Chrome版本（地址栏输入chrome://version/）
去ChromeDriver官网下载对应版本的驱动
把驱动放到系统PATH路径下

不过现在有个更简单的方法，使用webdriver-manager：

pip install webdriver-manager

这样就不用手动下载驱动了，它会自动帮你管理。

第一个Selenium脚本：Hello World

环境搭建好了，来写第一个脚本试试水：

from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from webdriver_manager.chrome import ChromeDriverManager

# 创建浏览器实例
driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()))

# 打开网页
driver.get("https://www.baidu.com")

# 找到搜索框并输入内容
search_box = driver.find_element("name", "wd")
search_box.send_keys("Selenium自动化测试")

# 点击搜索按钮
search_button = driver.find_element("id", "su")
search_button.click()

# 等待几秒钟看结果
import time
time.sleep(3)

# 关闭浏览器
driver.quit()

运行这个脚本，你会看到浏览器自动打开，搜索，然后关闭。就像有个看不见的人在操作一样，是不是很神奇？

元素定位：找到你要的那个按钮

自动化测试的核心就是找元素。网页上那么多按钮、输入框、链接…怎么准确找到你要的那个？

Selenium提供了8种定位方式：

1. 通过ID定位（最可靠的方式）

element = driver.find_element("id", "username")

2. 通过Name定位

element = driver.find_element("name", "password")

3. 通过Class Name定位

element = driver.find_element("class name", "login-button")

4. 通过Tag Name定位

element = driver.find_element("tag name", "input")

5. 通过Link Text定位（链接文本）

element = driver.find_element("link text", "登录")

6. 通过Partial Link Text定位

element = driver.find_element("partial link text", "登")

7. 通过XPath定位（最强大但也最复杂）

element = driver.find_element("xpath", "//input[@type='submit']")

8. 通过CSS Selector定位

element = driver.find_element("css selector", "input.login-btn")

小贴士： ID定位是最稳定的，因为ID在页面中应该是唯一的。XPath和CSS Selector功能最强大，但也最容易因为页面结构变化而失效。

常用操作：让浏览器干活

找到元素后，我们就可以对它进行各种操作了：

文本输入和清空

# 输入文本
input_box.send_keys("要输入的内容")
# 清空输入框
input_box.clear()
# 输入特殊键（比如回车）
from selenium.webdriver.common.keys import Keys
input_box.send_keys(Keys.ENTER)

点击操作

button.click()

获取文本和属性

# 获取元素文本
text = element.text
# 获取属性值
value = element.get_attribute("value")

截图（调试神器）

driver.save_screenshot("screenshot.png")

等待机制：耐心是美德

这里有个大坑！！！很多新手写的脚本经常莫名其妙地失败，原因往往是没处理好等待。

网页加载需要时间，如果你的脚本跑得比网页加载还快，当然会出错。Selenium提供了三种等待方式：

1. 强制等待（不推荐）

import time
time.sleep(5)  # 无脑等5秒

这种方式简单粗暴，但效率低。网页可能2秒就加载完了，你还要傻等5秒。

2. 隐式等待

driver.implicitly_wait(10)  # 设置全局等待时间

告诉WebDriver，如果找不到元素，就等等，最多等10秒。

3. 显式等待（推荐）

from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By

wait = WebDriverWait(driver, 10)
element = wait.until(EC.presence_of_element_located((By.ID, "myElement")))

这种方式最智能，一旦条件满足就立即继续，最大程度节省时间。

处理复杂场景

下拉框操作

from selenium.webdriver.support.ui import Select

select_element = driver.find_element("id", "country")
select = Select(select_element)

# 通过可见文本选择
select.select_by_visible_text("中国")
# 通过值选择
select.select_by_value("cn")
# 通过索引选择
select.select_by_index(0)

弹窗处理

# 处理alert弹窗
alert = driver.switch_to.alert
alert.accept()  # 点击确定
# alert.dismiss()  # 点击取消

多窗口切换

# 获取所有窗口句柄
handles = driver.window_handles
# 切换到新窗口
driver.switch_to.window(handles[1])

框架切换

# 切换到iframe
driver.switch_to.frame("frameName")
# 切回主页面
driver.switch_to.default_content()

实战案例：自动登录脚本

来写个实用的例子，自动登录某个网站：

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from webdriver_manager.chrome import ChromeDriverManager
from selenium.webdriver.chrome.service import Service

def auto_login(username, password):
    # 启动浏览器
    driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()))
    
    try:
        # 打开登录页面
        driver.get("https://example.com/login")
        
        # 等待页面加载完成
        wait = WebDriverWait(driver, 10)
        
        # 输入用户名
        username_input = wait.until(
            EC.presence_of_element_located((By.NAME, "username"))
        )
        username_input.send_keys(username)
        
        # 输入密码
        password_input = driver.find_element(By.NAME, "password")
        password_input.send_keys(password)
        
        # 点击登录按钮
        login_button = driver.find_element(By.XPATH, "//button[@type='submit']")
        login_button.click()
        
        # 等待登录成功跳转
        wait.until(EC.title_contains("Dashboard"))
        
        print("登录成功！")
        
        # 可以继续执行其他操作...
        
    except Exception as e:
        print(f"登录失败：{e}")
    
    finally:
        # 记得关闭浏览器
        driver.quit()

# 使用方法
auto_login("your_username", "your_password")

常见问题和解决方案

1. 元素找不到

这是最常见的问题。解决方法：

检查页面是否完全加载
确认定位方式是否正确
使用浏览器开发者工具检查元素

2. 脚本运行慢

合理使用等待机制
考虑使用无头模式（headless）
禁用图片加载（如果不需要的话）

3. 浏览器版本兼容性

使用webdriver-manager自动管理驱动
定期更新Selenium版本

4. 反爬检测

现在很多网站都有反爬机制，可能会检测到你在使用自动化工具。这时候需要：

设置User-Agent
添加随机延时
使用代理IP
模拟人类行为

进阶技巧

无头模式运行

from selenium.webdriver.chrome.options import Options

chrome_options = Options()
chrome_options.add_argument("--headless")
driver = webdriver.Chrome(options=chrome_options)

无头模式下浏览器不会显示界面，运行速度更快，适合批量任务。

设置浏览器选项

chrome_options = Options()
chrome_options.add_argument("--window-size=1920,1080")
chrome_options.add_argument("--disable-extensions")
chrome_options.add_argument("--no-sandbox")
chrome_options.add_argument("--disable-dev-shm-usage")

执行JavaScript代码

# 滚动到页面底部
driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")

# 点击被其他元素遮挡的按钮
driver.execute_script("arguments[0].click();", button)

测试框架集成

Selenium通常不是单独使用的，而是和测试框架结合：

与pytest结合

import pytest
from selenium import webdriver

@pytest.fixture
def driver():
    driver = webdriver.Chrome()
    yield driver
    driver.quit()

def test_login(driver):
    driver.get("https://example.com")
    # 测试逻辑...
    assert "欢迎" in driver.title

与unittest结合

import unittest
from selenium import webdriver

class LoginTest(unittest.TestCase):
    
    def setUp(self):
        self.driver = webdriver.Chrome()
    
    def test_valid_login(self):
        # 测试逻辑...
        pass
    
    def tearDown(self):
        self.driver.quit()