python 文件夹批量docx转txt

import os
from docx import Document # python-docx

# 指定Word文档文件夹的路径
root_folder = r'E:\file'

# 确保指定的文件夹存在
if not os.path.exists(root_folder):
    print("指定的文件夹不存在。")
else:
    # 遍历Word文档文件夹中的所有Word文档
    for province_filename in os.listdir(root_folder):
        if province_filename.endswith("省") or province_filename.endswith("市") or province_filename.endswith("区"):
            province_folder=os.path.join(root_folder, province_filename)
            print(province_folder)
            for city_filename in os.listdir(province_folder):
                if city_filename.endswith("市"):
                    city_folder=os.path.join(province_folder, city_filename)
                    print(city_folder)
                    for docx_name in os.listdir(city_folder):
                        print(docx_name)
                        if docx_name.endswith('.docx'):
                            docx_path = os.path.join(city_folder, docx_name)
                            print(docx_path)
                            txt_filename = os.path.splitext(docx_name)[0] + '.txt'
                            txt_path = os.path.join(city_folder, txt_filename)
                            # 打开Word文档
                            doc = Document(docx_path)
                            # 创建一个TXT文件并将Word文档内容写入其中
                            with open(txt_path, 'w', encoding='utf-8') as txt_file:
                                for paragraph in doc.paragraphs:
                                    txt_file.write(paragraph.text + '\n')
                                print("Word文档已成功转换为UTF-8编码的TXT文件。")

  • 8
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值