多html整理合并pdf

版权声明:本文为博主原创文章,转载 请注明出处:https://blog.csdn.net/sc2079/article/details/106246106

-写在前面


  最近想提升自己的PPT制作能力,便下载了某PPT教程类微信公共号的html文档,非常多,感觉一篇篇挨着看效率不高。因此,有了分类整理并制作PDF文档的想法。

Snipaste_2020-05-20_21-29-59.png

- 环境配置安装


  运行环境:Python3.6、Spyder;

 
  依赖模块:pdfkit、PyPDF2等。

 
注:pdfkit的安装可以参考: python将html转化为pdf

- 开始工作


1.读取目录

  首先,要有待整理文档的分类目录,示例如下:
Snipaste_2020-05-20_21-33-31.png
  我采用字典存储目录。

#读取txt文档目录
def read_txt(file):
    contents={
   }
    with open (file,'r') as f:
        for line in f.readlines():
            if line!='\n':
                line=line.replace('\n','')
                if re.search('^[0-9]+\.',line):
                    content=[]
                    contents[line]=content
                    continue
                else:
                    line=line.replace('? ','')
                    content.append(line)

  可以根据自己的目录特点加以修改。根据目录整理文档

2. 根据目录将html文档分类复制到指定位置

def copy_file(file_from_path,file_to_path,contents):
    if os.path.isdir(file_from_path):
        old_files=os.listdir(file_from_path)
        tt=findStr(old_files[0],'_',2)+1
        _old_files=[]
        for old_file in old_files:
            _old_file=old_file[tt:
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值