多html整理合并pdf

最新推荐文章于 2023-04-17 18:23:45 发布

scyf340

最新推荐文章于 2023-04-17 18:23:45 发布

阅读量1.4k

点赞数

分类专栏： work by python 文章标签： html pdf 文件合并公共号

本文链接：https://blog.csdn.net/sc2079/article/details/106246106

版权

-写在前面

最近想提升自己的PPT制作能力，便下载了某PPT教程类微信公共号的html文档，非常多，感觉一篇篇挨着看效率不高。因此，有了分类整理并制作PDF文档的想法。

- 环境配置安装

运行环境：Python3.6、Spyder；

　
依赖模块：pdfkit、PyPDF2等。

　
注：pdfkit的安装可以参考： python将html转化为pdf

- 开始工作

1.读取目录

首先，要有待整理文档的分类目录，示例如下：

我采用字典存储目录。

#读取txt文档目录
def read_txt(file):
    contents={
   }
    with open (file,'r') as f:
        for line in f.readlines():
            if line!='\n':
                line=line.replace('\n','')
                if re.search('^[0-9]+\.',line):
                    content=[]
                    contents[line]=content
                    continue
                else:
                    line=line.replace('? ','')
                    content.append(line)

可以根据自己的目录特点加以修改。根据目录整理文档

2. 根据目录将html文档分类复制到指定位置

def copy_file(file_from_path,file_to_path,contents):
    if os.path.isdir(file_from_path):
        old_files=os.listdir(file_from_path)
        tt=findStr(old_files[0],'_',2)+1
        _old_files=[]
        for old_file in old_files:
            _old_file=old_file[tt:

最低0.47元/天解锁文章

scyf340

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
多html整理合并pdf

版权声明：本文为博主原创文章，转载请注明出处：https://blog.csdn.net/sc2079/article/details/90478551#-写在前面最近想提升自己的PPT制作能力，便下载了某PPT教程类微信公共号的html文档，非常多，感觉一篇篇挨着看效率不高。因此，有了分类整理并制作PDF文档的想法。- 环境配置安装　　运行环境：Python3.6、Spyder 　依赖模块：pdfkit、PyPDF2等 *注：pdfkit的安装可以参考[pyth
复制链接

扫一扫