现有表一和表二,有姓名列和论文数量列,需要按照姓名将两个Excel文件合并。
合并后的效果:
import pandas as pd
df1 = pd.read_excel(r'/content/1.xlsx') #默认读取表一的sheet1数据
df2 = pd.read_excel(r'/content/2.xlsx') #默认读取表二的sheet1数据
result=df1.merge(df2,on='姓名',how='left')
print(result)
# 保存数据
result.to_csv('/content/result.csv',index=False,encoding='utf-8-sig')
其中merge函数中,
1)on表示要加入的列或索引级别名称。 必须在左侧和右侧DataFrame对象中找到。
2)how表示以哪个表中的列为匹配标准。其值有left ,right ,inner, outer. 类似sql关联中的 left join,right join 等。
推荐一个可视化pandas操作的网站,让你通过图形化动态展示pandas各个函数的使用方法 https://pandastutor.com/