Python+selenium批量把网页文档保存为PDF

本文介绍如何利用Python的selenium库配合Chrome浏览器的打印功能,批量将含有丰富排版的网页保存为PDF文件,从而保留网页的原始样式。教程链接提供了一个实现方法。
摘要由CSDN通过智能技术生成

网上有很多网页版的,免费的Python教程电子书,特别想保存下来,写爬虫的话,文字可以取出来,但是漂亮的版面就丢了啊,要是想保留排版样式,那代码量可就太大了,再说我也不会写啊。想了一下,发现可以直接利用Chrome浏览器的自带功能,批量把网页打印成PDF,岂不是很方便,这样只需要利用selenium就可以啦。网上找了找,果然有大佬写出了教程。
参考教程地址:https://www.cnblogs.com/new-june/p/14509601.html

在这里插入图片描述
爬取网页结构如图,代码如下

import requests
import os
import time
import random
import re
import pdfkit
from bs4 import BeautifulSoup
from lxml.html import etree

import os,json,time
from selenium import webdriver
from selenium.webdriver.common.keys import Keys




def get_text(url):
    # 获取url的内容,调用频率极高
    headers = {
   
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36'}
    response = requests.get(url, headers=headers)
    response
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

搬码工琪老师

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值