批量更改后缀名:将.txt文件更改为.xml文件
作用说明
在进行数据挖掘的时候,将txt文本信息进行批量的数据处理为xml文本,为下一步转化为csv文件,提取有用的信息做准备
代码
#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time : 2021/05/20
# @Author : Kenn_Wu
# Purpose: Convert .txt files to.xml files
# You need to run this code under the txt folder
import os
import sys
txt_path = ('./') # 需要转化的txt文件夹路径
xml_path = ('E:\Desktop\\data_txt\\xml_done/') # 输出文件夹路径
def txt_to_xml(indir,outdir):
files_list = os.listdir(indir) # 读取文件夹下的文件列表
for filename in files_list:
used_name = os.path.splitext(filename) # 分离文件名与后缀名
if used_name[1] == '.txt': # 根据需要的后缀名修改文件类型,不同的类型剔除
new_name = used_name[0] + '.xml'
os.rename(filename,new_name )
print("文件%s从重命名成功,新的文件名为%s"%(filename, new_name))
print('Successfully converted .txt to .xml')
if __name__=='__main__':
txt_to_xml(txt_path, xml_path)
运行效果:
.txt 转化为 .xml 文件
待更新版本…
实现功能, 读取/保存 不在同一文件夹下的文件:
待更新。。。