Python数据预处理中将word文本转txt形式(1)切分路径

这篇博客介绍了如何使用Python进行数据预处理,将word文档转换为txt格式。首先,通过切分路径来确定文件的保存位置。接着,定义了文件命名规则和操作系统的目录参数。在Python3环境下,以utf-8编码处理文件,通过主程序调用方法获取文件的绝对路径,寻找需要转换的word文档,并最终执行转换操作。
摘要由CSDN通过智能技术生成

 首先第一步 切分路径 即为默认保存路径。

 命名文件名为“转txt” ,在书写代码时要尽量标准的写出其功能及相关参数,以供未来便捷使用

 本次采用utf-8格式,使用python3编程环境

 

# coding=utf-8
'''
Description:Word文档信息提取
Author:shenxiaohua
Prompt:code in python3 env
'''
'''
功能描述:word转txt 默认保存在根目录下 支持自定义.
参数描述:1.filePath:文件路径 2.savePath:保存路径
'''

 第二步  定义本文件的两个参数,dirs为显示目录,导入操作系统os

import os

def 转txt(filePath,savePath=''):
    # 1 切分文件路径 为文件目录和文件名
    dirs,filename = os.path.split(filePath)
    print(dirs,'\n',filename)
    pass

第三步 写主程序 调用方法设置路径获取其绝对路径 找到需转换文件的路径


if __name__== '__main__':
    filePath = os.path.abspath(r'../G:/python文件/venv/转换文件.doc')
    转txt(filePath)</
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值