pandas 中的merge是一种功能比较强大的用于两个DataFrame或者Series进行合并的方法.
合并时会将所有的列进行合并,但是指定键值不存在行列会填充NaN.
直接复制官方文档 :
DataFrame.merge(right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=False, suffixes=('_x', '_y'), copy=True, indicator=False, validate=None)
常用参数解释:
right : DataFrame or named Series:
当使用pandas.merge()时,right处实际填入两个待合并的结构;当使用dataframe.merge()时,right处仅填入一个待合并的结构,此处的right与dataframe分别作为右/左结构.
how : {‘left’, ‘right’, ‘outer’, ‘inner’}, default ‘inner’:
how指定了结构的融合的类型,是一个关于key的重要参数
默认inner,即采用交叉部分的key作为列的内容
left: 即选取左侧结构的key作为列的内容
right: 即选取左侧结构的key作为列的内容
outer: 选取所有的键作为列内容.
不存在的内容用NaN填充
on : label or list
Column or index level names to join on. These must be found in both DataFrames.
参数on指定了用于合并的键key.