# docx文件批量转txt文件,传入docx文件夹路径
def docx2txt(input):
docx_name_list = os.listdir(input)
for dn in docx_name_list:
if not os.path.splitext(dn)[1] == ".docx": # 筛选文件类型,注意”.“
continue
wordapp = wc.Dispatch('Word.Application')
path1= os.path.join(input, dn)
doc = wordapp.Documents.Open(path1)
output = os.path.splitext(dn)[0]
output = os.path.join(input, output)
doc.SaveAs(output, 4) # 为了让python可以在后续操作中r方式读取txt和不产生乱码,参数为4
doc.Close()
path1 = r'E:\NLP\02 Database\Document\baiduAItest\docx'
docx2txt(path1)
python实现docx文件批量转txt文件
最新推荐文章于 2024-05-23 14:45:36 发布