连接方式
pandas.merge 根据一个或多个键将行进行连接,与SQL数据库的1连接操作类似
pandas.concat 使对象在轴向上进行黏合或 ‘堆叠’
join()方法将不再解释
combine_first()实例方法允许将重叠的数据拼接在一起,以使用一个对象的值填充另个对象的缺失值
pd.merge() 横向连接
多对一连接:df1在连接键所对应列中的值每个值有多个,df2在连接键所对应列中的值每个值有一个
多对多链接:df1在连接键所对应列中的值每个值有多个,df2在连接键所对应列中的值每个值有多个
多对多连接是行的笛卡尔积(df1有3行的值为‘b’,df2有2行的值为‘b’,连接后的结果中会有3*2行‘b’)
函数参数:
left 左边的DataFrame
right 右边的DataFrame
how 'inner’,'outer','left','right'之一,默认是'inner'
on 需要连接的列名,必须是在两边的DataFrame对象都有的列名,并以left和right中的列名的交集作为连接键
left_on left DataFrame中用做连接的键
right_on right DataFrame中用做连接的键
left_index 使用left的行索引作为他的连接键(如果是multiindex,则是多个键)
right_index 使用right的行索引作为他的连接键(如果是multiindex,则是多个键)
sort 通过连接键按字母顺序对合并的