python如何下载selenium_如何使用Python,Selenium和PhantomJS下载文件

小编典典

我找到了一个解决方案,并希望分享。一项要求发生了变化,我不再使用PhantomJS了,但chromedriver它与虚拟帧缓冲区毫无关系。结果相同,就可以完成工作。

您需要的是:

pip install selenium pyvirtualdisplay

apt-get install xvfb

我将Py3.5和ovh.net的测试文件与标签而不是按钮一起使用。脚本等待页面上显示,然后单击它。如果您不等待该元素并且位于异步站点上,那么您尝试单击的元素可能还不存在。下载位置是相对于脚本位置的文件夹。该脚本会检查该目录,如果文件已被第二次延迟下载。如果我没有记错的话,在下载过程中文件应该是.part,并且一旦它变成filename脚本中指定的.dat,就应该完成。如果关闭虚拟帧缓冲区和驱动程序,下载将无法完成。完整的脚本如下所示:

# !/usr/bin/python

# coding: utf-8

import os

import sys

import time

from pyvirtualdisplay import Display

from selenium import webdriver

from selenium.webdriver.support.wait import WebDriverWait

from selenium.webdriver.support import expected_conditions as EC

from selenium.webdriver.common.by import By

import glob

def main(argv):

url = 'http://ovh.net/files'

dl_dir = 'downloads'

filename = '1Mio.dat'

display = Display(visible=0, size=(800, 600))

display.start()

chrome_options = webdriver.ChromeOptions()

dl_location = os.path.join(os.getcwd(), dl_dir)

prefs = {"download.default_directory": dl_location}

chrome_options.add_experimental_option("prefs", prefs)

chromedriver = "./chromedriver"

driver = webdriver.Chrome(executable_path=chromedriver, chrome_options=chrome_options)

driver.set_window_size(800, 600)

driver.get(url)

WebDriverWait(driver, 30).until(EC.presence_of_element_located((By.XPATH, '//a[@href="' + filename + '"]')))

hyperlink = driver.find_element_by_xpath('//a[@href="' + filename + '"]')

hyperlink.click()

while not(glob.glob(os.path.join(dl_location, filename))):

time.sleep(1)

driver.close()

display.stop()

if __name__ == '__main__':

main(sys.argv)

我希望这对以后的人有所帮助。

2020-06-26

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值