1. pd.concat 级联(相当于append的功能),默认join的方式outer (外连接,缺少的数据默认全部是补NaN),默认按axis=0级联
不匹配级联指的是当两个表的维度的索引不一致的时候会出现的情况,横向级联是行索引会出现不一致的情况,纵向级联是列索引会出现不一致的情况,有两种级联的方式,一种是外连接,一种是内连接,外连接默认是会把所有的数据都补全,但是内连接(inner)是只连接匹配的那些项,不处理那些不能级联的。
2. pd.merge()合并操作,默认情况下使用两表中公有的列作为合并条件
- merge与concat的区别在于,merge需要依据某一共同列来进行合并
- 使用pd.merge()合并时,会自动根据两者相同column名称的那一列,作为key来进行合并,其余的则丢弃, eg: pd.merge(df1,df2)
- 注意每一列元素的顺序不要求一致
2.1 merge里面的参数:
how = ‘left’ 以左表为准,左表中的数据需要全部显示
how=‘right’ 以右表为准,右表中的数据需要全部显示
how=‘outer’ 所有数据全部都有,没有的补NaN
how='inner' 内连接,默认的方式