Selenium加--headless无界面下无法抓取图片或者其他文件的解决

本文探讨了如何在使用Selenium进行无界面(headless)的Chrome浏览器下载图片和其他文件时遇到的问题,并提供了相应的代码调整和参数设置方法。通过添加`Page.setDownloadBehavior`命令,确保在Chrome Headless模式下下载功能的启用。
摘要由CSDN通过智能技术生成

Selenium加–headless无界面下无法抓取图片或者其他文件的解决

  • 贴上代码

    url = '你的url'
    def enable_download_in_headless_chrome(browser, download_dir):
        #add missing support for chrome "send_command"  to selenium webdriver
        browser.command_executor._commands["send_command"] = ("POST", '/session/$sessionId/chromium/send_command')
    
        params = {'cmd': 'Page.setDownloadBehavior', 'params': {'behavior': 'allow', 'downloadPath': download_dir}}
        browser.execute("send_command", params)
    
    options = webdriver.ChromeOptions()
    options.add_argument('--headless')
    options.add_argument("--user-agent=Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.159 Safari/537.36")
    options.add_argument('--window-size=1280,1024')
    
    # options.add_experimental_option("prefs", {
    #   "download.default_directory":DIR_NAME,
    # })
    
    
    driver = webdriver.Chrome(executable_path='D:/webdriver/chromedriver',chrome_options=options)
    
    driver.set_window_size(1280, 720) 
    DIR_NAME ='E:/test_my/'
    
    enable_download_in_headless_chrome(driver, DIR_NAME)
    URL = url
    # print(URL)
    # print ("loading url")
    driver.get(URL)
    time.sleep(3)
    cookie_list = driver.get_cookies()
    cookie_list
    
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小帆芽芽

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值