合并数据
pd.merge()是顶级的类方法,实例对象没有该方法,此函数是针对DataFrame对象。
与pd.concat()的最大区别,pd.concat()依据index/columns在轴方向罗列,pd.merge()依据具体数据连接。
参数 | 类型 | 说明 |
left/right | DataFrame | 进行合并的两个DataFrame对象 |
how | inner outer left right |
inner 默认值 inner 两个DataFrame对象的交集 outer 两个DataFrame对象的并集 left 以 ldf 为主体,rdf不足数据用Nan填充,求两个DataFrame对象的并集(ldf的数据肯定没有Nan) right 以 rdf 为主体,ldf不足数据用Nan填充,求两个DataFrame对象的并集(rdf的数据肯定没有Nan) |
on | 字符串 列表 |
设置 key 的方式1 Key是columns,在两个DataFrame对象中有相同的columns(列标签),需要用on指明哪个列作为key (当两个DataFrame对象有相同的columns(列标签)时,且以其中的某个column或是某几个column为key) pd.merge(ldf |