1,利用python读取纯文字的word文档,读取段落和段落里的文字。
先读取段落,代码如下:
1 '''
2 #利用python读取word文档,先读取段落3 '''
4 #导入所需库
5 from docx importDocument6
7 #打开word文档
8 document = Document("D:/路径/长恨歌.docx")9
10 #获取所有段落
11 all_paragraphs =document.paragraphs12 #打印看看all_paragraphs是什么东西
13 print(type(all_paragraphs)) #,打印后发现是列表
14 #是列表就开始循环读取
15 for paragraph inall_paragraphs:16 #打印每一个段落的文字
17 print(paragraph.text)
效果:
再读取段落里的内容,代码如下:
1 '''
2 #利用python读取word文档3 '''
4 #导入所需库
5 from docx importDocument6
7 #打开word文档
8 document = Document("D:/路径/长恨歌.docx")9