'''
Data:2017-07-13
Auther;JXNU Kerwin
Description:使用Pandas拼接多个CSV文件到一个文件(即合并)
'''
import pandas as pd
import os
Folder_Path = r'C:\foldername' #要拼接的文件夹及其完整路径,注意不要包含中文
SaveFile_Path = r'C:\foldername' #拼接后要保存的文件路径
SaveFile_Name = r'all.csv' #合并后要保存的文件名
#修改当前工作目录
os.chdir(Folder_Path)
#将该文件夹下的所有文件名存入一个列表
file_list = os.listdir()
#读取第一个CSV文件并包含表头
df = pd.read_csv(Folder_Path +'\\'+ file_list[0]) #编码默认UTF-8,若乱码自行更改
#将读取的第一个CSV文件写入合并后的文件保存
df.to_csv(SaveFile_Path+'\\'+ SaveFile_Name,encoding="utf_8_sig",index=False)
#循环遍历列表中各个CSV文件名,并追加到合并后的文件
for i in range(1,len(file_list)):
df = pd.read_csv(Folder_Path + '\\'+ file_list[i])
df.to_csv(SaveFile_Path+'\\'+ SaveFile_Name,encoding="utf_8_sig",index=False, header=False, mode='a+')
博主链接:https://blog.csdn.net/weixin_42001089/article/details/88990398
首先我们明白就是除了保留第一个文件的列名外,后续文件的列名我们是不需要的,于是我们可以这样:
import glob
import os
import pandas as pd
inputfile = str(os.path.dirname(os.getcwd()))+"/Data/*.csv"
outputfile = str(os.path.dirname(os.getcwd()))+"/Data/result.csv"
csv_list = glob.glob(inputfile)
filepath = csv_list [0]
df = pd.read_csv(filepath)
df = df.to_csv(outputfile,index=False)
for i in range(1,len(csv_list)):
filepath = csv_list [i]
df = pd.read_csv(filepath)
df = df.to_csv(outputfile,index=False, header=False,mode='a+')
header=False要记得