概述python中的合并数据集包括多表联合查询,轴向连接,合并重叠数据。多表联合查询通过一个或多个键将行链接起来。
相关函数:merge,join。
2.轴向连接类似于集合的并集操作。
相关函数:concatenate,concat
3.合并重叠数据类似于numpy的where函数,用于表达一种是量化的if-else
相关函数:combine_first
一、多表联合查询
1.merge函数
a.函数说明
merge(left, right, how='inner', on=None, left_on=None, right_on=None, left_index=False,
right_index=False, sort=False, suffixes=('_x', '_y'), copy=True, indicator=False, validate=None)how : {'left', 'right', 'outer', 'inner'}
on : 必须是同时存在于两个表中的列。
left_on/ right_on : 用作连接的列,二者一一对应。
left_index/right_index : 布尔型。将行索引用作连接键,两边键数必须相同。
sort:根据连接键对合并后的数据进行排序。
suffixes : 用作处理重复列名。
b.merge默认将重叠列的列名当做键,最好使用on显式指定。merge默认做的是'inner'连接,其他方式还有'left','right&#