pd.merge(df1, df2, how, on......)
- df1和df2是两个dataframe数据框;
- how指的是以哪种方式合并,“left”是以左边的数据框为基准,也就是保留左边数据框的全部,右边的数据框根据数据的有无填充进去,“right”同理;
- on指的是两个数据框以哪一列为基准进行合并;
# 读取excel数据
df1 = pd.read_excel(file_list1[i])
df2 = pd.read_excel(file_list2[i])
# 以右边数据框的“date”列为基准对数据进行横向合并,并对缺失的地方填充上-6999
df = pd.merge(df1, df2, how="right", on=['date']).fillna(-6999)
pd.concat([df1, df2, .....], axis)
- df1和df2是两个dataframe数据框,省略号代表一次可以合并很多个;
- axis=0代表头尾合并,axis=1代表横着合并
# 读取excel数据
df1 = pd.read_excel(file_list1[i])
df2 = pd.read_excel(file_list2[i])
# 两个数据框横着合并
df = pd.concat([df1, df2], axis = 1)
两者的应用和区别
- pd.merge()只能横向合并,pd.concat()可以横向、纵向合并;
- pd.merge()一次只能横向合并两个数据框,pd.concat()可以横向、纵向合并多个数据框;
- pd.merge()横向合并时不会要求两个数据框纵向维度相同,pd.concat()横向合并时则要求;
总结
要求以某列(比如时间)为基准提取数据框公共部分的时候,用pd.merge(),其余时候可以用pd.concat()。