合并
pandas中的合并操作和sql中的join操作非常相似。
假设有df1,df2需要合并,参数on代表通过那个键合并:
# 通过key字段合并,类似于 mysql 的 select * from df1 inner join df2 on df1.key = df2.key
pd.merge(df1,df2,on='key')
如果用于合并的键位名字不同,我们也可以分别制定:
# df1的leky和df2的rkey合并
pd.merge(df1,df2,left_on='lkey',right_on='rkey')
sql中的合并方式有多种,有 left join,right join 等等,pandas中我们使用参数 how 来选取合并方式:
pd.merge(df1,df2,how='outer')
联接
不同于merge , concat更类似于在横向(axis = 1)或者纵向 (axis = 0) 累加。详细参考利用python进行数据分析
参考文献:
[1] 利用python进行数据分析