关于我之前项目
HTML提取数据,保存Docx
发表我一些自己的想法和见解。
其实针对数据保存模块我主要的是使用python的第三方模块python-docx库,本库支持docx的编辑和读写,可以更好将提取出来的数据更好更方便的保存成docx文件。但是也存在一点弊端就是它不支持读写doc文件。
import docx
doc = docx.Document(file_path) # 读取文档
doc.save(file_path) # 保存文档
# 其中还有很多的方法,比如插入分页符、插入段落、插入图片、修改文字样式等
# 就自行查看官方文档吧
特别声明,读写速度其实不是很快。