今晚写机器学习回归算法时,需要先预处理一下txt数据,原数据之间隔了不等个空格,需要处理成以逗号分隔,用Python写了一个小脚本批量处理。
原数据
处理后的数据
源代码如下
#!/usr/bin/python
# -*- coding: utf-8 -*-
#为了可以添加中文注释
file = 'C:\Users\zhuhuihui\Desktop\data3.txt' #原始数据目录
file_write = 'C:\Users\zhuhuihui\Desktop\data4.txt' #新写入数据目录
f = open(file,'r') #只读模式打开
f_w = open(file_write,'w')
for eachline in f: #按行读入
if(eachline != '\n'):
eachline = ','.join(eachline.split()) #将连续空格替换成‘,'
f_w.write(eachline) #将数据写入新的txt
f_w.write('\n') #换行
f.close() #关闭
f_w.close()