selenium模拟鼠标滑动
在自动化或者爬虫中往往需要使用selenium模拟鼠标滑动功能,找了好久都没有找到合适的代码,于是干脆自己写一个
这是可以实现滑动的js代码,需要做的就是将以下代码加入selenium中
let intervalId;
function scrollPage() {
window.scrollBy(0,10);//设置每次滚动10个像素
}
// 添加滚动事件监听器
window.addEventListener('scroll', function checkIfBottom() {
// 检查是否到达可视区域底部(这里使用了一个常见的判断方法)
if (window.innerHeight + window.scrollY >= document.body.scrollHeight) {
clearInterval(intervalId);
window.removeEventListener('scroll', checkIfBottom); // 停止监听滚动事件
}
});
intervalId = setInterval(scrollPage,10);//每隔10毫秒执行一次滚动
以下代码可以适配大多数的网页
# 导入必要的模块
from selenium import webdriver # 导入Selenium的webdriver模块,用于控制浏览器
import threading # 导入线程模块,用于多线程处理
import time # 导入时间模块,用于控制程序的执行时间
# 创建浏览器驱动实例(这里以Chrome为例)
service = webdriver.EdgeService(executable_path='./msedgedriver.exe') # 创建Edge浏览器的服务实例
driver = webdriver.Edge(service=service) # 使用上一步创建的服务实例来创建一个Edge浏览器驱动实例
# 访问某个网页
driver.get('url') # 使用驱动实例打开指定的网页
def scroll_to_bottom():
global driver # 使用全局变量driver,确保该函数能访问到驱动实例
while True: # 无限循环,直到满足退出条件
# 执行滚动操作
driver.execute_script("window.scrollBy(0,8);") # 滚动页面,每次向下滚动8px
# 检查是否到达页面底部(这里假设当滚动到底部时,body的高度不再变化)
body_height = driver.execute_script("return document.body.scrollHeight;") # 获取页面主体的总高度
current_scroll = driver.execute_script("return document.documentElement.scrollTop || document.body.scrollTop;") # 获取当前滚动条的位置
if current_scroll + driver.execute_script("return window.innerHeight;") >= body_height: # 当当前滚动条的位置加上视口的高度大于或等于页面的总高度时,满足退出条件
break # 跳出循环
# 尝试模拟10毫秒的间隔,但由于线程切换的时间开销,这个间隔并不能保证精准为10毫秒
time.sleep(0.001) # 1毫秒睡眠(实际可能会大于1毫秒) # 1毫秒睡眠(实际可能会大于1毫秒)这一行重复了,应该删除一个
# 开始滚动任务
scroll_thread = threading.Thread(target=scroll_to_bottom) # 创建一个新线程来执行滚动任务
scroll_thread.start() # 启动新线程
# 确保主线程等待滚动任务完成
scroll_thread.join() # 主线程会等待滚动任务完成后再继续执行下面的代码
print('滑动已完成') # 打印“滑动已完成”到控制台,表示滚动任务已完成
time.sleep(20) # 使程序暂停20秒,这里主要用于模拟人工查看网页的过程,你可以根据实际需求调整时间
# 清理资源
driver.quit() # 关闭浏览器驱动实例,释放资源
对上面的代码优化了一下
# 导入所需的模块
from selenium import webdriver # 导入Selenium的webdriver模块,用于控制浏览器
from selenium.webdriver.support import expected_conditions as EC # 导入预期条件,用于等待某个条件成立后再执行下一步操作
import time # 导入时间模块,用于控制程序的执行时间
# 创建浏览器驱动实例(以Chrome为例)
service = webdriver.EdgeService(executable_path='./msedgedriver.exe') # 创建Edge浏览器的服务实例
driver = webdriver.Edge(service=service) # 使用上一步创建的服务实例来创建一个Edge浏览器驱动实例
# 访问某个网页
driver.get('url') # 使用驱动实例打开指定的网页
# 定义滚动到页面底部的函数
def scroll_to_bottom(driver): # 定义一个名为scroll_to_bottom的函数,参数为driver
# 执行滚动操作,并使用EC.implicitly_wait来等待滚动完成
body_height = driver.execute_script("return document.body.scrollHeight;") # 执行JavaScript代码,获取页面主体的总高度
current_scroll = driver.execute_script("return document.documentElement.scrollTop || document.body.scrollTop;") # 获取当前滚动条的位置
while current_scroll + driver.execute_script("return window.innerHeight;") < body_height: # 当当前滚动条的位置加上视口的高度小于页面的总高度时,继续循环
driver.execute_script("window.scrollBy(0,8);") # 滚动页面,每次向下滚动8px
current_scroll = driver.execute_script("return document.documentElement.scrollTop || document.body.scrollTop;") # 获取滚动后的滚动条位置
driver.implicitly_wait(1) # 设置隐式等待时间为1秒,以便在滚动过程中检查元素是否出现
driver.implicitly_wait(0) # 当滚动到达底部时,取消隐式等待,不再等待元素出现
# 开始滚动任务
scroll_to_bottom(driver) # 调用scroll_to_bottom函数,传入驱动实例作为参数,开始滚动任务
print('滚动已完成') # 打印“滚动已完成”到控制台,表示滚动任务已完成
# 等待8秒
time.sleep(20) # 使程序暂停8秒,这里主要用于模拟人工查看网页的过程,你可以根据实际需求调整时间
# 清理资源
driver.quit() # 关闭浏览器驱动实例,释放资源