python编辑word与读Excel的经验
前段时间为了解决工作上的一些问题,有听说python有相关的库编辑Office文档很方便,就被骗进坑了。为了避免后来者再遇到相同的坑,所以把这些经验写下来方便后来者。
首先描述一下我打算实现的功能,我打算根据Excel表中的值,来对Word中相应的词进行替换,以达到自动化根据模板处理文档的功能。简单的来说就是批量Ctrl+H和重命名文件。
一、按照Ecxel表格中的一些关键词替换word文档中的相应词,再按照某个关键词保存成单个word文档。
二、标记处两个表格中差异的部分(找出表格中那里被重新编译过)
然后在介绍下我用到的第三方库:docx,xlrd,openxl
值得注意的是,docx库只能编辑docx文件,openxl只能读写xlsx文件,xlrd只能读xls和xlsx文件,使用时要注意文件格式,区别doc与docx,xls与xlsx。
三、认识要操作的对象:
Word:一个文件对应一个doc对象先载入from docx import Document
然后打开文件
doc1 = Document('path') # 打开模板
这个对象中我主要操作的是,文段paragraphs和表格tables,其他还有很多内部的对象我也没必要一个个去研究,相比之下可视化(shou dong)操作更适合处理那些问题。文段和表格划分的范围比较大,一般以大段落和和文本框划定。文段和表格中的字段中有很多的字段runs,代表了各个不同格式的小段。