html转pdf的三种方式,pdf-lib合并pdf

项目中遇到需要xml打印pdf的功能,通过查找资料找到三种方式处理

  • html转图片
  • 使用浏览器的打印功能 window.print
  • 使用无头浏览器(底部有github地址,欢迎star)

1.把html转成图片塞到pdf中,使用jspdf和html2Canvas两个插件

安装

npm i jspdf -S
npm i html2Canvas -S

使用方式就是使用html2Canvas把dom转成图片,然后通过截图的方式把图片添加到pdf中

const canvas = await html2Canvas(dom, {
  allowTaint: false,
  taintTest: false,
  logging: false,
  useCORS: true,
  dpi: window.devicePixelRatio * 4, // 将分辨率提高到特定的DPI 提高四倍
  scale: 4 // 按比例增加分辨率
})
const pageData = canvas.toDataURL('image/jpeg', 1.0);
const a4w = 277
const a4h = 190
const alias = `myImage${i + 1}`
console.log(alias);
// 此处示例,参数3和4可以处理图片的开始位置的xy
pdf.addImage(pageData, 'JPEG', 10, 10, a4w, a4h, alias)
// 多页需要添加新的page
pdf.addPage()

2.使用window.print()转pdf

网上使用有各种插件,print.js,vue-print,可以自行查找资料,我使用的是原生打印
我使用了两种方式,一种直接获取dom的innerHTML复制给body,使用css样式做分页处理,由于我加载的固定的xml,直接固定宽高,使用css标记处理打印分页

page-break-after: always;
@media print {
  @page {
    size: auto;
    margin: 0;
  }
  .drawio-item {
    margin: 0;
  }
  // 设置打印时的缩放,由于使用的a4大小比例问题,1169*827,实际 794*1123,做了一个缩放处理
  .print-page {
    zoom: calc(794/827);
  }
// js
document.body.id = 'print-html'
// 使用框架影响到打印分页样式,所以做了一个特殊处理
document.body.innerHTML = this.$refs.contentRef.innerHTML
window.print()
location.reload()

上面这种方式处理会刷新页面对用户不友好,后面查找到iframe的方式,实现原理一样

document.body.id = 'print-html'
  const iframe = document.createElement("iframe");
  document.body.appendChild(iframe)
  
  iframe.setAttribute(
    "style",
    "position:fixed;width:100%;height:100%;left:0;top:0;z-index: 100;"
  );
  const head = document.createElement('head')
  const style = document.createElement('style')
  style.innerHTML = `
  .print-page {
    zoom: calc(${794/827});
    page-break-after: always;
    display: flex;
    justify-content: center;
    align-items: center;
  }
  * {
    margin: 0;
    padding: 0;
  }
  @media print {
    @page {
      size: auto;
      margin: 0;
    }
  }`
  head.appendChild(style)
  iframe.contentDocument.write(head.innerHTML)
  iframe.contentDocument.write(this.$refs.contentRef.innerHTML);
  iframe.contentDocument.close();
  // 加载完成
  iframe.onload = function() {
   iframe.contentWindow.print();
   document.body.removeChild(iframe)
 }

2024/1/4更新

3.无头浏览器需要再node环境上运行,puppeteer
puppeteer中文文档

const puppeteer = require('puppeteer')
async function printPDF() {
  const browser = await puppeteer.launch({ headless: true, args: ['--no-sandbox', '--disable-setuid-sandbox'] })
  const page = await browser.newPage()
  // 示例使用百度网站,实际需要对应的静态页面做特殊处理转pdf的内容
  await page.goto('https://www.baidu.com/')
  const file = await page.pdf({ format: 'A4'})
  await browser.close()
  return file
}
// 拿到文件通过接口传递给前端
const file = printPDF()

2024/2/8更新

补充puppeteer转pdf,合并分页逻辑,合并pdf
使用pdf-lib做pdf的合并,每一页单独加载转换pdf

核心逻辑:在需要打印pdf的页面,把加载好的html的文本传递给node后台,使用puppeteer的setContent加载完成后转pdf然后再把文件流返回给前台

github样例地址 可以直接本地运行

const { PDFDocument } = require('pdf-lib')
// htmls是html片段,在无头浏览器里面加载完成转换pdf
const { landscape, format, htmls } = data
function generatePdf(data) {
  	const pdfDoc = await PDFDocument.create()
	for (let i = 0; i < htmls.length; i++) {
	  const page = await browser.newPage()
	  await page.setContent(htmls[i], {waitUntil: 'networkidle0'})
	  console.log(i, 'i');
	  const fileBufer = await page.pdf({ format, landscape })
	  const coverDoc = await PDFDocument.load(fileBufer)
	  const [coverPage] = await pdfDoc.copyPages(coverDoc, [0])
	  pdfDoc.addPage(coverPage)
	  // const fileName = `${__dirname}/ceshi${i}.pdf`
	  // fileList.push(fileName)
	  // PDFMergeJs.add(fileName)
	}
	// 获取文件流返回给前端
	const pdfBytes = await pdfDoc.save()
	const pdf_path = 'merged.pdf'
	// // console.log(pdfBytes);
	await writeFile(pdf_path, pdfBytes);
}

  • 6
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值