python读取docx格式文档并输出
一、问题描述
读取指定文件夹中的docx格式文件,并打印输出
二、操作步骤
1、安装docx库,并引入该模块
(1)打开系统dos窗口,输入命令即可安装:pip install python-docx
注:安装前建议先查看系统是否已有该库
查看命令为:pip list
(2)引入docx模块:import docx
import docx
2、设置文件路径
path = "C:\\test1.docx"
3、通过path路径读取文件对象
file = docx.Document(path)
4、打印输出文件
使用for循环打印输出结果段落文本
for f in file.paragraphs:
print(f.text)
5、完整代码
import docx
#文件路径
path = "C:\\test.docx"
#读取文件对象
file = docx.Document(path)
#循环打印输出段落
for f in file.paragraphs:
print(f.text)
6、运行结果展示
三、扩展及改进
以上是读取一个docx文件的操作步骤及代码。如果需要读取指定文件夹中所有的docx格式文件,则需要先读取文件夹中文件的名称保存到list列表中,从list列表中读取文件名和路径进行拼接后,再按拼接的路径读取文档即可。
第一次写,不喜勿喷,感谢感谢!