python docx 合并文档 图片_Python合并word文档制作电子书

2086fb0b8a6799a0f75585418064ea31.png

需求:

将某大V公众号文章全部下载,整理成合集,并整理成电子书进行阅读。

以冯大辉老师公众号【小道消息】为例

实现步骤

一、批量下载公众号文章

使用 WeChatDownloadv20200423 工具将公众号文章下载成word文档。

截止今日(20200602)共获取到 1278 个 Word 文档

二、合并多个word文档为一个文档

以前是 Word 中添加对象中文字合并的,但效率比较低下,一次只能添加几十个。且无标题。

于是乎尝试使用 Python 将多 Word 文档进行合并,并根据原word文档名称生成标题。

三、合并 Word 文档 Python 代码

感觉python运行了小20分钟才合并完成,不过1278个文档,并手工效率高太多。

四、优化 Word 文档

删掉其中的无关、不需要、重复字样。

删除 ‘精选留言’ '赞无'

删除空行

删除无字标题(没有发现统一方法,手工干,或者不删除影响不大)

删除'阅读原文','阅读全文'

文档5046页,内容超级丰富。

f63f3021527666dfc3015f49e9a33c72.png

五、转换为 Epub 格式电子书

转换为epub格式电子书,供手机阅读

先转换为 pdf 格式

4c5e4e1b43e4cc7a7c684672f716d083.png

pdf 格式转换为Epub

b3e8338938d0e214f84f54e1b3a89c94.png

9119f09875ec0fa7f5a050b91488e009.png

154M的电子书就制作完成了,上传喜欢的app就可以开始读书、听书了。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值