同一文件夹类所有CSV文件汇总
#导入相应模块
import re
import os
import pandas as pd
import numpy as np
#定义一个空列表 C:\Users\qiupan\Desktop\汇总
data_list = []
file_in = "C:/Users/qiupan/Desktop/huiz/"
file_out = "C:/Users/qiupan/Desktop/test1126.csv"
for info in os.listdir(file_in):
domain = os.path.abspath(file_in) #获取文件夹的路径
info = os.path.join(domain,info) #将路径与文件名结合起来就是每个文件的完整路径
data = pd.read_csv(info,encoding='GBK')
data_list.append(data)
# 将读入的数据连接
all_data = pd.concat(data_list)
all_data = all_data.drop_duplicates(["账务流水号"],keep="last")
all_data.tail()
#将DataFrame存储为csv,index表示是否显示行名,default=True
all_data.to_csv(file_out,index=False,sep=',')