之前遇到的一个小需求,需要对一个文件夹内的20张表的数据进行聚合运算,所以记录一下:
引包
import pandas as pd
import os
代码
def read_heat_data(dir_name):
csvFilePath = './{}'.format(dir_name)
heatdfList = []
for fName in os.listdir(csvFilePath):
fPath = '{}/{}'.format(csvFilePath, fName)
heatdfList.append(pd.read_csv(fPath))
heat_data = pd.concat(heatdfList,ignore_index=True)
return heat_data
其中dir_name 为文件夹名称,返回的为一个DataFrame。可以在concat的同时进行聚合运算,如透视表或者groupby。