pip install python-docx
Word文档结构
Document:文档
Paragraph:段落
Run:文字块
读取Word文档内容
doc.paragraphs 得到的是一个列表,包含了每个段落的实例
from docx import Document
doc = Document('这是一个文档.docx')
print(doc.paragraphs)
paragraphs.text 得到该段落的文字内容
from docx import Document
doc = Document