selenium模拟鼠标滚动

Ru_qian

已于 2024-01-09 17:31:08 修改

阅读量935

点赞数 9

文章标签： python selenium 爬虫

于 2024-01-08 22:07:19 首次发布

本文链接：https://blog.csdn.net/LEITANAN/article/details/135467387

版权

本文详细介绍了如何使用Selenium库在自动化测试或爬虫中实现鼠标模拟滑动功能，包括自定义JavaScript代码和优化后的版本，涉及多线程处理、滚动事件监听以及隐式等待机制。

摘要由CSDN通过智能技术生成

selenium模拟鼠标滑动

在自动化或者爬虫中往往需要使用selenium模拟鼠标滑动功能，找了好久都没有找到合适的代码，于是干脆自己写一个

这是可以实现滑动的js代码，需要做的就是将以下代码加入selenium中

let intervalId;

function scrollPage() {
    window.scrollBy(0,10);//设置每次滚动10个像素
}

// 添加滚动事件监听器
window.addEventListener('scroll', function checkIfBottom() {
    // 检查是否到达可视区域底部（这里使用了一个常见的判断方法）
    if (window.innerHeight + window.scrollY >= document.body.scrollHeight) {
        clearInterval(intervalId);
        window.removeEventListener('scroll', checkIfBottom); // 停止监听滚动事件
    }
});

intervalId = setInterval(scrollPage,10);//每隔10毫秒执行一次滚动

以下代码可以适配大多数的网页

# 导入必要的模块  
from selenium import webdriver  # 导入Selenium的webdriver模块，用于控制浏览器  
import threading  # 导入线程模块，用于多线程处理  
import time  # 导入时间模块，用于控制程序的执行时间  
  
# 创建浏览器驱动实例（这里以Chrome为例）  
service = webdriver.EdgeService(executable_path='./msedgedriver.exe')  # 创建Edge浏览器的服务实例  
driver = webdriver.Edge(service=service)  # 使用上一步创建的服务实例来创建一个Edge浏览器驱动实例  
  
# 访问某个网页  
driver.get('url')  # 使用驱动实例打开指定的网页  
  
def scroll_to_bottom():  
    global driver  # 使用全局变量driver，确保该函数能访问到驱动实例  
    while True:  # 无限循环，直到满足退出条件  
        # 执行滚动操作  
        driver.execute_script("window.scrollBy(0,8);")  # 滚动页面，每次向下滚动8px  
        # 检查是否到达页面底部（这里假设当滚动到底部时，body的高度不再变化）  
        body_height = driver.execute_script("return document.body.scrollHeight;")  # 获取页面主体的总高度  
        current_scroll = driver.execute_script("return document.documentElement.scrollTop || document.body.scrollTop;")  # 获取当前滚动条的位置  
        if current_scroll + driver.execute_script("return window.innerHeight;") >= body_height:  # 当当前滚动条的位置加上视口的高度大于或等于页面的总高度时，满足退出条件  
            break  # 跳出循环  
        # 尝试模拟10毫秒的间隔，但由于线程切换的时间开销，这个间隔并不能保证精准为10毫秒  
        time.sleep(0.001)  # 1毫秒睡眠（实际可能会大于1毫秒）  # 1毫秒睡眠（实际可能会大于1毫秒）这一行重复了，应该删除一个  
  
# 开始滚动任务  
scroll_thread = threading.Thread(target=scroll_to_bottom)  # 创建一个新线程来执行滚动任务  
scroll_thread.start()  # 启动新线程  
# 确保主线程等待滚动任务完成  
scroll_thread.join()  # 主线程会等待滚动任务完成后再继续执行下面的代码  
  
print('滑动已完成')  # 打印“滑动已完成”到控制台，表示滚动任务已完成  
time.sleep(20)  # 使程序暂停20秒，这里主要用于模拟人工查看网页的过程，你可以根据实际需求调整时间  
# 清理资源  
driver.quit()  # 关闭浏览器驱动实例，释放资源

对上面的代码优化了一下

# 导入所需的模块  
from selenium import webdriver  # 导入Selenium的webdriver模块，用于控制浏览器  
from selenium.webdriver.support import expected_conditions as EC  # 导入预期条件，用于等待某个条件成立后再执行下一步操作  
import time  # 导入时间模块，用于控制程序的执行时间  
  
# 创建浏览器驱动实例（以Chrome为例）  
service = webdriver.EdgeService(executable_path='./msedgedriver.exe')  # 创建Edge浏览器的服务实例  
driver = webdriver.Edge(service=service)  # 使用上一步创建的服务实例来创建一个Edge浏览器驱动实例  
  
# 访问某个网页  
driver.get('url')  # 使用驱动实例打开指定的网页  
 
# 定义滚动到页面底部的函数  
def scroll_to_bottom(driver):  # 定义一个名为scroll_to_bottom的函数，参数为driver  
    # 执行滚动操作，并使用EC.implicitly_wait来等待滚动完成  
    body_height = driver.execute_script("return document.body.scrollHeight;")  # 执行JavaScript代码，获取页面主体的总高度  
    current_scroll = driver.execute_script("return document.documentElement.scrollTop || document.body.scrollTop;")  # 获取当前滚动条的位置  
    while current_scroll + driver.execute_script("return window.innerHeight;") < body_height:  # 当当前滚动条的位置加上视口的高度小于页面的总高度时，继续循环  
        driver.execute_script("window.scrollBy(0,8);")  # 滚动页面，每次向下滚动8px  
        current_scroll = driver.execute_script("return document.documentElement.scrollTop || document.body.scrollTop;")  # 获取滚动后的滚动条位置  
        driver.implicitly_wait(1)  # 设置隐式等待时间为1秒，以便在滚动过程中检查元素是否出现  
    driver.implicitly_wait(0)  # 当滚动到达底部时，取消隐式等待，不再等待元素出现  
  
# 开始滚动任务  
scroll_to_bottom(driver)  # 调用scroll_to_bottom函数，传入驱动实例作为参数，开始滚动任务  
print('滚动已完成')  # 打印“滚动已完成”到控制台，表示滚动任务已完成  
# 等待8秒  
time.sleep(20)  # 使程序暂停8秒，这里主要用于模拟人工查看网页的过程，你可以根据实际需求调整时间  
# 清理资源  
driver.quit()  # 关闭浏览器驱动实例，释放资源