AI办公自动化:批量把docx文档转换为txt文本

任务:把docx文档批量转换成txt,首先让deepseek写了一段代码,但是转换失败。用的是最流行的python-docx库来读取docx文档,但是始终无法读取成功,换成pywin32库就解决问题了。

在deepseek中输入提示词:

写一个Python脚本,打开文件夹:F:\AI自媒体内容\,用pywin32库把里面所有的docx文档内容读取出来,然后保存到txt文档中,文件名保持一致,也保存在同一个文件夹中。一步步的思考,但是代码都整合在一起

源代码:

import os

import win32com.client as win32

# 定义源文件夹路径

source_folder = r'F:\AI自媒体内容'

# 初始化Word应用程序

word_app = win32.gencache.EnsureDispatch('Word.Application')

word_app.Visible = False # 设置Word应用程序为不可见

# 遍历文件夹中的所有.docx文件

for filename in os.listdir(source_folder):

if filename.endswith('.docx'):

# 构建完整的文件路径

file_path = os.path.join(source_folder, filename)

# 打开.docx文件

try:

doc = word_app.Documents.Open(file_path)

except Exception as e:

print(f"无法打开文件 {filename},错误信息:{e}")

continue

# 读取文档内容

content = doc.Content.Text

# 创建新的.txt文件名

txt_filename = filename.replace('.docx', '.txt')

# 将内容写入.txt文件

with open(os.path.join(source_folder, txt_filename), 'w', encoding='utf-8') as f:

f.write(content)

# 关闭Word文档

doc.Close()

print(f"文件 {filename} 已成功转换为 {txt_filename}")

# 关闭Word应用程序

word_app.Quit()

print("转换完成!")

  • 5
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值