dd = pd.merge(df,df2,how='outer')
外连接是两个表连接的一种方式,给人的印象是外连接的话,连接后的表会变大。
he 122
0 1 2
1 2 3
上面是表1,下面是表2
he 1222
0 1 1
1 1 2
2 1 2
3 2 2
4 2 2
5 2 2
这两个表有相同的index he
连接的时候,he等于1 122 等于2 1222有三个取值。
自己看看吧,连接之后的|:
he 122 1222
0 1 2 1
1 1 2 2
2 1 2 2
3 2 3 2
4 2 3 2
5 2 3 2
如果第一个表有m行,第二个表有n行,两者之间没有相同的index时,外连接是m*n。
此时,内连接则是0.