流程的python 下载_Selenium(Python)-等待使用Chrome Web驱动程序完成下载过程

博主正使用Selenium和Python的Chromedriver在Windows上自动化下载多个PDF文件。遇到的问题是必须使用静态等待确保文件下载完成,这在多线程环境中显得效率低下。目前的代码会在点击下载按钮后休眠10秒。寻求解决方案以避免硬编码的time.sleep,并能确定下载何时真正完成。
摘要由CSDN通过智能技术生成

我正在通过chromewebdriver(windows)使用selenium和python来自动执行从不同页面下载大量文件的任务。我的代码可以运行,但是解决方案远非理想:下面的函数单击网站按钮,该按钮会启动Java脚本函数,该函数会生成PDF文件,然后下载该文件。

我必须使用静态等待才能等待下载完成(丑陋)。我无法检查文件系统以确认下载何时完成,因为我使用的是多线程(从不同页面下载很多文件)一次),并且文件名也会在网站本身中动态生成。

我的代码:

def file_download(num, drivervar):

Counter += 1

try:

drivervar.get(url[num])

download_button = WebDriverWait(drivervar, 20).until(EC.element_to_be_clickable((By.ID, 'download button ID')))

download_button.click()

time.sleep(10)

except TimeoutException: # Retry once

print('Timeout in thread number: ' + str(num) + ', retrying...')

.....

是否可以在webdriver中确定下载完成?我想避免使用time.sleep(x)。

非常感谢。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值