首先,在cmd中输入命令行pip install python-docx,下载安装模块python-docx:
安装成功的样子
输入命令行pip install pdfminer3k安装模块:
安装pdfminer
首先我们来看看文件目录:
文件目录
然后开始写读取txt文本的代码:
def readTxt():
# 读取txt
ftxt = open('《盗墓笔记少年篇沙海》.txt') # open里的为文件路径
x = ftxt.read() # x即为读取的文件内容
ftxt.close() # 关闭文档流
return x # 返回读取到的文件内容
接下来是读取word文本的代码:
def readWord():
# 读取word
import docx # 引入python-docx模块,是的你没有看错,名字不一样
fword = docx.Document('盗墓笔记.docx') # 括号内的为文件路径
str1 = ''
for para in fword.paragraphs: # 读取word的每一段内容
str1 += para.te