利用Chrome Headless模式网页转PDF

本文转载于:https://blog.csdn.net/aWDac/article/details/80865754
      https://blog.csdn.net/xcl168/article/details/75675781
后台网页截图参考:https://blog.csdn.net/xsviglh_/article/details/105321649

一、概述

  试过使用wkhtmltopdf来将网页打印成PDF文件,但有些网页转出来是空白的。然后发现Chrome Headless模式可以实现我想要的,而且用Chrome来实现,可以排除掉很多Bug。
  Chrome Headless模式相当于一个没有界面的浏览器,能实现很多功能,能实现pdf打印,截图等,扩展下,可以 做web测试,爬虫抓取等等。

二、安装

sudo apt-get install libxss1 libappindicator1 libindicator7
wget https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb
sudo dpkg -i google-chrome-stable_current_amd64.deb
sudo apt-get install -f

三、命令使用

google-chrome --headless --disable-gpu --print-to-pdf='test.pdf' https://www.aliyun.com/

参数说明:

  • –headless:无头模式,就是无界面模式运行
  • –print-to-pdf:指定转pdf的路径和名称
  • –no-sandbox:让Chrome在root权限下跑
  • –window-size:专门应对无头浏览器中不能最大化屏幕的方案,如–window-size=1920,1080

四、Java中使用

<dependency>
  <groupId>io.github.fanyong920</groupId>
  <artifactId>jvppeteer</artifactId>
  <version>1.1.1</version>
</dependency>
  • 生成页面的 PDF
	//自动下载,第一次下载后不会再下载
    BrowserFetcher.downloadIfNotExist(null);
    ArrayList<String> arrayList = new ArrayList<>();
    //生成pdf必须在无厘头模式下才能生效
    LaunchOptions options = new LaunchOptionsBuilder().withArgs(arrayList).withHeadless(true).build();
    arrayList.add("--no-sandbox");
    arrayList.add("--disable-setuid-sandbox");
    Browser browser = Puppeteer.launch(options);
    Page page = browser.newPage();
    page.goTo("https://www.baidu.com/?tn=98012088_10_dg&ch=3");
    PDFOptions pdfOptions = new PDFOptions();
    pdfOptions.setPath("test.pdf");
    page.pdf(pdfOptions);
    page.close();
    browser.close();

四、 官方文档

https://developers.google.cn/web/updates/2017/04/headless-chrome#create_a_pdf

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
Chrome-headless是Google针对Chrome浏览器59版新增加的一种模式,可以在不打开UI界面的情况下使用Chrome浏览器,并保持与Chrome完全一致的运行效果。它使用方法与Selenium类似。 要使用Chrome-headless,首先需要安装ChromeDriver。可以通过以下步骤来安装ChromeDriver: 1. 下载ChromeDriver:使用wget命令下载ChromeDriver,例如:`wget https://chromedriver.storage.googleapis.com/2.40/chromedriver_linux64.zip` 2. 解压ChromeDriver:使用tar命令解压下载的ChromeDriver文件,例如:`tar xvf chromedriver_linux64.zip` 3. 设置权限:使用chmod命令给解压后的ChromeDriver设置可执行权限,例如:`chmod 755 chromedriver` 配置代码如下所示: ```python from selenium import webdriver from selenium.webdriver.chrome.options import Options chrome_options = Options() chrome_options.add_argument('--headless') chrome_options.add_argument('--disable‐gpu') # 设置Chrome浏览器文件路径 path = r'C:\Program Files (x86)\Google\Chrome\Application\chrome.exe' chrome_options.binary_location = path # 创建Chrome-headless浏览器实例 browser = webdriver.Chrome(chrome_options=chrome_options) ``` 通过以上配置代码,你就可以使用Chrome-headless模式进行你需要的操作了。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [Chrome-headless 使用](https://blog.csdn.net/grey_mouse/article/details/128243165)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* [Chromeheadless安装与使用](https://blog.csdn.net/aWDac/article/details/80865754)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值