写在前面——近日在处理数据的时候发现有的文件为csv文件,有的为tsv文件,大概搜了一下了解到:TSV是用制表符(‘\t’)作为字段值的分隔符;CSV是用半角逗号(‘,’)作为字段值的分隔符。https://www.jianshu.com/p/6e1c3e9f5e42
所以我需要把格式统一,把tsv转化为csv,还需要在最后一列加上label。
代码是自己东拼西凑的,如有错误,请指出,谢谢大家~
import pandas as pd
import os
# 原始文件位置
source_path = "./tsv_data/"
# 保存位置
save_path = "./csv_data/"
if not os.path.exists(save_path):
os.mkdir(save_path)
pathDir = os.listdir(source_path)
Name = []
End = []
# 获得文件的名称和后缀
def getName(workdir