Pandas中Merge方法。
与SQL相同,我们想根据关键字,查找其他表相同关键字的内容,并匹配合并到一个表中。
Merge方法,实现多个excel文件按照关键字,匹配合并字段。
def merge(left, right, how='inner', on=None, left_on=None, right_on=None,
left_index=False, right_index=False, sort=False,
suffixes=('_x', '_y'), copy=True, indicator=False,
validate=None)
“left”— 作为基础文件,用于匹配 right 文件的数据框,并在此表中,追加 right 文件匹配的内容。内容填写任何N/A为NaN
“right” — 作为被匹配的文件输入,并与 left 文件的DataFrame匹配。 填写任何N/A为NaN
数据框(DataFrame,是Pandas库中的一种数据结构,它类似excel,是一种二维表)
import pandas as pd
import numpy as np
fileName = '01.xls'
fileName2 = '02.xlsx'
df1 = pd.read_excel(fileName)
df2 = pd.read_excel(fileName2)
df_Merge=pd.merge(df1,df2)
print(df_Merge)
表df1
序号 | 城市 |
1 | 郑州市 |
2 | 呼和浩特市 |
3 | 金华市 |
4 | 柳州市 |
5 | 苏州市 |
表df2
城市 | 序号1 |
苏州市 | 4 |
柳州市 | 6 |
呼和浩特市 | 11 |
郑州市 | 22 |
金华市 | 31 |
表df_Merge
序号 | 城市 | 序号1 |
1 | 郑州市 | 22 |
2 | 呼和浩特市 | 11 |
3 | 金华市 | 31 |
4 | 柳州市 | 6 |
5 | 苏州市 | 4 |