最近数据合并工作较多,手动合并太费时费力了,再来一波工具。
1、源数据如下:
测试数据简单,想想下几十上百张这种excel,每个excel表中几千上万条数据的合并....
2、程序合并代码
运行须安装pandas,我的文件放于项目下的csvunion目录中:
import glob
import os
import pandas as pd
inputfile = str(os.path.dirname(os.getcwd())) + "\myTools"+"\csvunion\*.csv"
outputfile = str(os.path.dirname(os.getcwd()))+ "\myTools"+"\csvunion\\testall.csv"
csv_list = glob.glob(inputfile)
filepath = csv_list [0]
df = pd.read_csv(filepath,encoding="gbk",low_memory=False)
df = df.to_csv(outputfile,encoding="gbk",index=False)
for i in range(1,len(csv_list)):
filepath = csv_list [i]
df = pd.read_csv(filepath,encoding="gbk",low_memory=False)
df = df.to_csv(outputfile,encoding="gbk",index=False,header=False,mode='a+')
3、运行结果
嗯,秒出结果。
我处理的数据是近500个csv文件,每个csv文件中有8万多条数据,这个方法真的是拯救了我。发出来共享一下。