Python Selenium 网页长截图/HTML 转 PDF

夏日麦香

于 2024-04-21 23:45:28 发布

阅读量100

点赞数

分类专栏：实际问题解决文章标签： python selenium 长截图 html转pdf

原文链接：https://blog.csdn.net/yutu75/article/details/115524985

版权

实际问题解决专栏收录该内容

32 篇文章 3 订阅

订阅专栏

当一件事情使用各种方法都不得其解时，不如换种思路。比如HTML直接转为PDF，涉及的安装包wkhtmltopdf各种报错各种搜索都无法解决后，那不如网页直接截图为图片格式，况且图片也可以转为PDF~。

（HTML直接转为PDF折腾了3天，网页直接截图为图片格式折腾俩小时，感谢网友分享！！）

转自：python+selenium 把整个网页截图长截图_python selenium 长网页截图-CSDN博客

链接：https://blog.csdn.net/yutu75/article/details/115524985

import time
from selenium import webdriver
from selenium.webdriver.chrome.options import Options

def get_image(url, pic_name):
    """
    #设置chrome开启的模式，headless就是无界面模式
    # 创建一个参数对象，用来控制chrome以无界面模式打开
    :param url:             获取获取网页的地址
    :param pic_name:        需要保存的文件名或路径＋文件名
    :return:
    """
    chrome_options = Options()
    chrome_options.add_argument('--headless')
    chrome_options.add_argument('--disable-gpu')
    # 创建浏览器对象
    driver = webdriver.Chrome(executable_path='./chromedriver', chrome_options=chrome_options)

    # 打开网页
    driver.get(url)
    # driver.maximize_window()
    # 加延时 防止未加载完就截图
    time.sleep(1)

    # 用js获取页面的宽高，如果有其他需要用js的部分也可以用这个方法
    width = driver.execute_script("return document.documentElement.scrollWidth")

    height = driver.execute_script("return document.documentElement.scrollHeight")

    # 获取页面宽度及其宽度
    print(width,height)

    # 将浏览器的宽高设置成刚刚获取的宽高
    driver.set_window_size(width, height)

    time.sleep(1)

    # 截图并关掉浏览器
    driver.get_screenshot_as_file(pic_name)

    driver.quit()


# 你输入的参数
url_str = 'http://www.cq.gov.cn'

pic_name = r'qwq.png'

get_image(url_str, pic_name)

夏日麦香

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python Selenium 网页长截图/HTML 转 PDF

当一件事情使用各种方法都不得其解时，不如换种思路。比如HTML直接转为PDF，涉及的安装包wkhtmltopdf各种报错各种搜索都无法解决后，那不如网页直接截图为图片格式，况且图片也可以转为PDF~。
复制链接

扫一扫