pandas的merge函数类似于数据库中的join操作,参数为
- left:需要join的第一个Dataframe
- right:需要join的第二个Dataframe
- how:如何join,可选{‘left’, ‘right’, ‘outer’, ‘inner’},默认为inner,left即只用左边的Dataframe的keys进行join,right只用右边的Dataframe的keys进行join,outer两个Dataframe的keys都用,inner只用交集的keys,这是数据库的基本知识
简单的例子
import pandas as pd
df1 = pd.DataFrame({'id':['A', 'A', 'C', 'B', 'C']})
df2 = pd.DataFrame({'id':['A', 'B', 'C'], 'count':[1, 2, 3]})
df3 = pd.merge(df1, df2, how='left')
df3
>>> id count
0 A 1
1 A 1
2 C 3
3 B 2
4 C 3