在同一个目录下有很多格式一样的txt 或者csv文件,怎么把他们合并成一个大的txt或者一个大的csv文件呢?
解决方案:
合并同一个文件下所有的txt:
# -*- coding: utf-8 -*-
import pandas as pd
import os
# 设定所有文件存放路径
save_path='D:/结果数据/'
# 设定合并数据集存放路径
save_merge_path='D:/合并数据/'
def concat_df(save_path,save_merge_path):
frames = []
"""合并数据框"""
for parent, dirnames, filenames in os.walk(save_path):
for filename in filenames:
print("正在处理文件 %s" % filename)
data1 = pd.read_table(save_path + filename, sep='\t')
print('%s 第一个文件加入添加列表' %filename)
frames.append(data1)
# 合并所有数据集
result = pd.concat(frames, axis=0, names=None)
# 输出数据到本地
result.to_csv(save_merge_path + 'data_result.txt', index=False, sep='\t')
# 主函数
if __name__ == '__main__':
concat_df(save_path,save_merge_path)
二、合并同一个文件夹下所有csv文件:
# -*- coding: utf-8 -*-
import pandas as pd
import os
# 设定所有文件存放路径
save_path='D:/works/result/'
# 设定合并数据集存放路径
save_merge_path='D:/works/merge/'
def concat_df(save_path,save_merge_path):
frames = []
"""合并数据框"""
for parent, dirnames, filenames in os.walk(save_path):
for filename in filenames:
print("正在处理文件 %s" % filename)
data1 = pd.read_csv(save_path + filename, sep=',', header=True)
frames.append(data1)
print('%s 第一个文件加入添加列表' %filename)
# 合并所有数据集
result = pd.concat(frames)
# 输出数据到本地
result.to_csv(save_merge_path+'result.csv',index=False,sep=',')
# 主函数
if __name__ == '__main__':
concat_df(save_path,save_merge_path)