python-docx库安装经历
1)cmd内输入
pip3 install python-docx
发现warning,显示pip版本过低导致安装第三方库失败,则先升级pip
python -m pip install --upgrade pip
升级后再进行安装,显示安装成功
2)后在 jupter notebook输入
from docx import Document
显示No module named 'docx'的报错信息,则在jupter notebook页面内输入
!pip install python-docx
一般情况下,jupter notebook内使用pip安装语句无误但报错时在pip前添加一个“ !”可以解决该类问题。
新建与读取、修改文档
首先导入库
from docx import Document
新建文件
doc_1 = Document()
# 保存文件(当前目录下) doc_1.save('文件名')
需要注意的是在新建文件后保存文件时,相同路径下若文件名重复则会报错
读取已有文件
doc = Document(r'路径')
修改文件
修改文件时首先需要知道该文件原有排版信息,可以使用document.paragraphs方法读取内容,但不能读取表格和图片,如果需要查看图片和表格,可以使用 document.tables和document.inline_shapes方法分别读取图片和表格。
for i,parag in enumerate(doc.paragraphs): # doc为上面实例化的命名 print('段落{}'.format(i),parag.text)
同样也可以查询之前原有样式,在修改或添加时方便引用原有格式
for s in doc.styles: print(s.type,s.name)